AI Yote Chini ya Paa Moja™

Vigunduzi vya AI hufanyaje kazi?

Vigunduzi vya AI hufanyaje kazi?

Jibu fupi: Vigunduzi vya AI havithibitishi ni nani aliyeandika kitu; vinakadiria jinsi kifungu kinavyolingana kwa karibu na mifumo ya lugha-mfano inayojulikana. Wengi hutegemea mchanganyiko wa viainishaji, ishara za kutabirika (mkanganyiko/mshtuko), mtindo, na, katika hali nadra, ukaguzi wa alama ya maji. Sampuli inapokuwa fupi, rasmi sana, ya kiufundi, au iliyoandikwa na mwandishi wa ESL, chukulia alama kama kidokezo cha kukagua - sio uamuzi.

Mambo muhimu ya kuzingatia:

Uwezekano, si uthibitisho : Chukulia asilimia kama ishara za hatari za "kufanana na AI", si uhakika.

Chanya za uongo : Uandishi rasmi, wa kiufundi, wa kiolezo, au usio wa asili mara nyingi huonyeshwa vibaya.

Mchanganyiko wa mbinu : Zana huchanganya viainishaji, utata/msisimko, mtindo, na ukaguzi usio wa kawaida wa alama za maji.

Uwazi : Pendelea vigunduzi vinavyoonyesha uso, vipengele, na kutokuwa na uhakika - si nambari moja tu.

Ushindani : Weka rasimu/maelezo na ushughulikie ushahidi uliopo kwa ajili ya migogoro na rufaa.

Vigunduzi vya AI hufanyaje kazi?

Makala ambazo unaweza kupenda kusoma baada ya hii:

🔗 Kigunduzi bora cha akili bandia (AI) ni kipi?
Zana bora za kugundua AI zililinganishwa kwa usahihi, vipengele, na matumizi.

🔗 Je, vigunduzi vya akili bandia (AI) vinaaminika?
Huelezea uaminifu, matokeo chanya yasiyo sahihi, na kwa nini matokeo mara nyingi hutofautiana.

🔗 Je! Turnitin inaweza kugundua AI?
Mwongozo kamili wa ugunduzi, mipaka, na mbinu bora za Turnitin AI.

🔗 Je, kigunduzi cha akili bandia cha QuillBot ni sahihi?
Mapitio ya kina ya usahihi, nguvu, udhaifu, na majaribio ya ulimwengu halisi.

1) Wazo la haraka - kigunduzi cha akili bandia (AI) kinafanya nini hasa ⚙️

Vigunduzi vingi vya AI havi "kukamata AI" kama wavu unaokamata samaki. Vinafanya kitu kisicho cha kawaida zaidi:

Wanakadiria uwezekano kwamba kipande cha maandishi kinaonekana kama kilitoka kwa mfumo wa lugha (au kilisaidiwa sana na kimoja). ( Utafiti kuhusu Ugunduzi wa Maandishi Uliozalishwa na LLM ; OpenAI )
Wanalinganisha maandishi yako na mifumo inayoonekana katika data ya mafunzo (maandishi ya kibinadamu dhidi ya maandishi yanayotokana na modeli). ( Utafiti kuhusu Ugunduzi wa Maandishi Uliozalishwa na LLM )
Wanatoa alama (mara nyingi asilimia) ambayo huhisi uhakika…lakini kwa kawaida sivyo. ( Miongozo ya Turnitin )

Tuwe wakweli - kiolesura cha mtumiaji kitasema kitu kama "92% AI," na ubongo wako utasema "karibu, nadhani hiyo ni ukweli." Sio ukweli. Ni dhana ya mwanamitindo kuhusu alama za vidole za mwanamitindo mwingine. Ambayo ni ya kuchekesha kidogo, kama mbwa wanaonusa mbwa 🐕🐕

2) Jinsi Vigunduzi vya AI Vinavyofanya Kazi: "injini za kugundua" zinazojulikana zaidi 🔍

Vigunduzi kwa kawaida hutumia moja (au mchanganyiko) wa mbinu hizi: ( Utafiti kuhusu Ugunduzi wa Maandishi Uliozalishwa na LLM )

A) Mifumo ya uainishaji (ya kawaida zaidi)

Mainishaji hufunzwa mifano yenye lebo:

Sampuli zilizoandikwa na binadamu
Sampuli zinazozalishwa na AI
Wakati mwingine sampuli za "mseto" (maandishi ya AI yaliyohaririwa na binadamu)

Kisha hujifunza mifumo inayotenganisha vikundi. Huu ndio mbinu ya kawaida ya kujifunza kwa mashine na inaweza kuwa nzuri kwa kushangaza ... hadi isiwe hivyo. ( Utafiti kuhusu Ugunduzi wa Maandishi Uliozalishwa na LLM )

B) Uchanganyiko na alama za "kupasuka" 📈

Baadhi ya vigunduzi huhesabu jinsi maandishi yanavyoweza "kutabirika".

Mshangao : kwa kiasi kikubwa, jinsi mfumo wa lugha unavyoshangazwa na neno linalofuata. ( Chuo Kikuu cha Boston - Machapisho ya Mshangao )
Kuchanganyikiwa kidogo kunaweza kupendekeza kwamba maandishi yanaweza kutabirika sana (ambayo yanaweza kutokea kwa matokeo ya AI). ( DetectGPT )
"Kupasuka" hujaribu kupima ni tofauti ngapi zilizopo katika ugumu na mdundo wa sentensi. ( GPTZero )

Mbinu hii ni rahisi na ya haraka. Pia ni rahisi kuichanganya, kwa sababu wanadamu wanaweza kuandika kwa njia inayotarajiwa pia (habari za barua pepe za kampuni). ( OpenAI )

C) Stylometria (kuandika alama za vidole) ✍️

Stylometry inaangalia mifumo kama:

urefu wa wastani wa sentensi
mtindo wa uakifishaji
masafa ya neno la kitendakazi (the, na, lakini…)
aina mbalimbali za msamiati
alama za usomaji

Ni kama "uchambuzi wa maandishi," isipokuwa maandishi. Wakati mwingine husaidia. Wakati mwingine ni kama kugundua mafua kwa kuangalia viatu vya mtu. ( Stylometria na sayansi ya uchunguzi wa kisayansi: Mapitio ya fasihi ; Maneno ya Kazi katika Uandishi )

D) Ugunduzi wa alama ya maji (wakati ipo) 🧩

Baadhi ya watoa huduma za modeli wanaweza kupachika ruwaza ndogo ("alama za maji") katika maandishi yaliyozalishwa. Ikiwa kigunduzi kinajua mpango wa alama za maji, kinaweza kujaribu kuthibitisha. ( Alama ya Maji kwa Mifano Kubwa ya Lugha ; Maandishi ya SynthID )

Lakini… si mifano yote ya alama ya maji, si matokeo yote yanayoweka alama ya maji baada ya kuhaririwa, na si vigunduzi vyote vinavyoweza kufikia mchuzi wa siri. Kwa hivyo si suluhisho la ulimwengu wote. ( Kuhusu Uaminifu wa Alama za Maji kwa Mifano Mikubwa ya Lugha ; OpenAI )

3) Ni nini kinachofanya toleo zuri la kigunduzi cha akili bandia ✅

Kigunduzi "kizuri" (kwa uzoefu wangu nikijaribu idadi yao sambamba kwa ajili ya mtiririko wa kazi za uhariri) si kile kinachopiga kelele zaidi. Ni kile kinachotenda kwa uwajibikaji.

Hapa kuna kinachofanya kigunduzi cha AI kuwa imara:

Imani iliyorekebishwa : 70% inapaswa kumaanisha kitu kinachoendelea, si kupunga mkono. ( Utafiti kuhusu Ugunduzi wa Maandishi Uliozalishwa na LLM )
Chanya cha chini cha uongo : haipaswi kuashiria Kiingereza kisicho cha asili, maandishi ya kisheria, au miongozo ya kiufundi kama "AI" kwa sababu tu ni safi. ( Stanford HAI ; Liang et al. (arXiv) )
Mipaka ya uwazi : inapaswa kukubali kutokuwa na uhakika na kuonyesha masafa, si kujifanya kuwa inajua yote. ( OpenAI ; Turnitin )
Ufahamu wa kikoa : wagunduzi waliofunzwa kwenye blogu za kawaida mara nyingi hupambana na maandishi ya kitaaluma na kinyume chake. ( Utafiti kuhusu Ugunduzi wa Maandishi Uliozalishwa na LLM )
Ushughulikiaji wa maandishi mafupi : zana nzuri huepuka alama za kujiamini kupita kiasi kwenye sampuli ndogo (aya si ulimwengu). ( OpenAI ; Turnitin )
Usikivu wa marekebisho : inapaswa kushughulikia uhariri wa kibinadamu bila kuanguka mara moja na kuwa matokeo yasiyo na maana. ( Utafiti kuhusu Ugunduzi wa Maandishi Uliozalishwa na LLM )

Wazuri zaidi ambao nimewaona huwa wanyenyekevu kidogo. Wabaya zaidi hutenda kama wanaosoma akili 😬

4) Jedwali la Ulinganisho - "aina" za kigunduzi cha AI cha kawaida na mahali zinapong'aa 🧾

Hapa chini kuna ulinganisho wa vitendo. Hizi si majina ya chapa - ndizo kategoria kuu utakazozipitia. ( Utafiti kuhusu Ugunduzi wa Maandishi Uliozalishwa na LLM )

Aina ya zana (jina)	Hadhira bora	Hisia ya bei	Kwa nini inafanya kazi (wakati mwingine)
Kikagua Mshangao Lite	Walimu, ukaguzi wa haraka	Huru-ish	Ishara ya haraka kuhusu utabiri - lakini inaweza kuwa ya kushtuka…
Kichanganuzi cha Kiainishaji Pro	Wahariri, HR, kufuata sheria	Usajili	Hujifunza mifumo kutoka kwa data iliyoandikwa - maandishi ya urefu wa wastani
Kichambuzi cha Stylometry	Watafiti, watu wa uchunguzi wa kisayansi	$$$ au niche	Hulinganisha alama za vidole vya kuandika - za ajabu lakini rahisi katika umbo refu
Kitafuta Alama ya Maji	Majukwaa, timu za ndani	Mara nyingi huwekwa pamoja	Imara wakati alama ya maji ipo - ikiwa haipo, kimsingi ni kuinua mabega
Suite ya Biashara Mseto	Mashirika makubwa	Kwa kila kiti, mikataba	Huchanganya ishara nyingi - ufikiaji bora, visu zaidi vya kurekebisha (na njia zaidi za kusanidi vibaya, oops)

Angalia safu wima ya "hisia ya bei". Ndiyo, hiyo si ya kisayansi. Lakini ni kweli 😄

5) Vigunduzi vya ishara kuu hutafuta - "huelezea" 🧠

Hivi ndivyo vigunduzi vingi hujaribu kupima chini ya kofia:

Utabiri (uwezekano wa tokeni)

Mifumo ya lugha hutoa maandishi kwa kutabiri ishara zinazowezekana zinazofuata. Hilo huelekea kuunda:

mabadiliko laini
chaguo chache za maneno za kushangaza
viambato vichache vya ajabu (isipokuwa kama vimeombwa)
sauti thabiti ( Chuo Kikuu cha Boston - Machapisho ya Kuchanganyikiwa ; DetectGPT )

Kwa upande mwingine, wanadamu mara nyingi huzunguka-zunguka zaidi. Tunapingana, tunaongeza maoni ya pembeni bila mpangilio, tunatumia sitiari zisizofaa kidogo - kama vile kulinganisha kigunduzi cha akili bandia na kibaniko kinachohukumu ushairi. sitiari hiyo ni mbaya, lakini unaelewa.

Mifumo ya marudio na muundo

Uandishi wa AI unaweza kuonyesha marudio madogo:

viunzi vya sentensi vinavyorudiwa ("Kwa kumalizia...", "Zaidi ya hayo...", "Zaidi ya hayo...")
urefu wa aya sawa
mwendo thabiti ( Utafiti kuhusu Ugunduzi wa Maandishi Uliozalishwa na LLM )

Lakini pia - wanadamu wengi huandika hivyo, hasa shuleni au katika mazingira ya makampuni. Kwa hivyo kurudia ni kidokezo, si uthibitisho.

Ufasaha kupita kiasi na nathari "safi sana" ✨

Hili ni jambo la ajabu. Baadhi ya vigunduzi huchukulia "maandishi safi sana" kama ya kutiliwa shaka. ( OpenAI )

Ambayo ni ya kutatanisha kwa sababu:

waandishi wazuri wapo
wahariri wapo
ukaguzi wa tahajia upo

Kwa hivyo ikiwa unafikiria Jinsi Vigunduzi vya AI Hufanya Kazi , sehemu ya jibu ni: wakati mwingine hulipa ukali. Ambayo ni ... aina ya kurudi nyuma.

Uzito wa kisemantiki na usemi wa jumla

Vigunduzi vinaweza kuashiria maandishi yanayohisi:

jumla kupita kiasi
maelezo mahususi yaliyo hai hayana maana
nzito kuhusu kauli zenye usawa na zisizoegemea upande wowote ( Utafiti kuhusu Ugunduzi wa Maandishi Uliozalishwa na LLM )

AI mara nyingi hutoa maudhui yanayosikika kuwa ya busara lakini yamepambwa kidogo. Kama chumba cha hoteli kinachoonekana kizuri lakini hakina utu wowote 🛏️

6) Mbinu ya uainishaji - jinsi inavyofunzwa (na kwa nini inavunjika) 🧪

Kigunduzi cha uainishaji kwa kawaida hufunzwa kama hivi:

Kusanya seti ya data ya maandishi ya kibinadamu (insha, makala, mabaraza, n.k.)
Tengeneza maandishi ya AI (vidokezo vingi, mitindo, urefu)
Weka alama kwenye sampuli
Jifunze modeli ili kuzitenganisha kwa kutumia vipengele au upachikaji
Ithibitishe kwenye data iliyohifadhiwa
Isafirishe…na kisha ukweli unaipiga usoni ( Utafiti kuhusu Ugunduzi wa Maandishi Uliozalishwa na LLM )

Kwa nini ukweli unaathiri:

Mabadiliko ya kikoa : data ya mafunzo hailingani na uandishi halisi wa mtumiaji
Mabadiliko ya modeli : modeli za kizazi kipya hazifanyi kama zile zilizo kwenye seti ya data
Athari za uhariri : marekebisho ya kibinadamu yanaweza kuondoa mifumo dhahiri lakini yanaweka ile isiyoonekana vizuri
Tofauti za lugha : lahaja, uandishi wa ESL, na mitindo rasmi husomwa vibaya ( Utafiti kuhusu Ugunduzi wa Maandishi Uliozalishwa na LLM ; Liang et al. (arXiv) )

Nimeona vigunduzi ambavyo vilikuwa "bora" kwenye seti yao ya majaribio, kisha vikaanguka kutokana na uandishi halisi wa mahali pa kazi. Ni kama kumfundisha mbwa anayenusa kwa chapa moja tu ya biskuti na kumtarajia apate kila vitafunio duniani 🍪

7) Kuchanganyikiwa na kuchanganyikiwa - njia ya mkato ya hesabu 📉

Familia hii ya vigunduzi huwa inategemea alama za modeli ya lugha:

Wanaendesha maandishi yako kupitia modeli inayokadiria uwezekano wa kila tokeni inayofuata.
Wanahesabu "mshangao" wa jumla (mkanganyiko). ( Chuo Kikuu cha Boston - Machapisho ya Mkanganyiko )
Wanaweza kuongeza vipimo vya tofauti ("mlipuko") ili kuona kama mdundo unahisi kama wa kibinadamu. ( GPTZero )

Kwa nini wakati mwingine hufanya kazi:

Maandishi ghafi ya AI yanaweza kuwa laini sana na yanayotabirika kitakwimu ( DetectGPT )

Kwa nini inashindwa:

Sampuli fupi zina kelele
uandishi rasmi unatabirika
uandishi wa kiufundi unatabirika
uandishi usio wa asili unaweza kutabirika
Maandishi ya AI yaliyohaririwa sana yanaweza kuonekana kama ya kibinadamu ( OpenAI ; Turnitin )

Kwa hivyo, Jinsi Vigunduzi vya AI Hufanya Kazi wakati mwingine hufanana na bunduki ya mwendo kasi inayochanganya baiskeli na pikipiki. Barabara ile ile, injini tofauti 🚲🏍️

8) Alama za maji - wazo la "alama za vidole kwenye wino" 🖋️

Kuweka alama ya maji kunasikika kama suluhisho safi: weka alama kwenye maandishi ya AI wakati wa uzalishaji, kisha uyagundue baadaye. ( Alama ya Maji kwa Mifano Kubwa ya Lugha ; Maandishi ya SynthID )

Kwa vitendo, alama za maji zinaweza kuwa dhaifu:

Kufafanua kunaweza kuzidhoofisha
tafsiri inaweza kuzivunja
nukuu isiyo kamili inaweza kuziondoa
Kuchanganya vyanzo vingi kunaweza kufifisha muundo ( Kuhusu Uaminifu wa Alama za Maji kwa Mifano Mikubwa ya Lugha )

Pia, ugunduzi wa alama ya maji hufanya kazi tu ikiwa:

alama ya maji hutumika
Kigunduzi kinajua jinsi ya kukiangalia
Maandishi hayajabadilishwa sana ( OpenAI ; SynthID Text )

Kwa hivyo ndiyo, alama za maji zinaweza kuwa na nguvu, lakini si beji ya polisi inayoweza kutumika kwa wote.

9) Mambo chanya ya uongo na kwa nini yanatokea (sehemu chungu) 😬

Hili linastahili sehemu yake kwa sababu ndipo utata mwingi unapoishi.

Vichocheo vya kawaida vya uongo chanya:

Sauti rasmi sana (kielimu, kisheria, uandishi wa kufuata sheria)
Kiingereza kisicho cha asili (miundo rahisi ya sentensi inaweza kuonekana kama "mfano wa kielelezo")
Uandishi unaotegemea kiolezo (barua za jalada, SOPs, ripoti za maabara)
Sampuli fupi za maandishi (ishara haitoshi)
Vizuizi vya mada (baadhi ya mada hulazimisha usemi unaojirudia) ( Liang et al. (arXiv) ; Turnitin )

Kama umewahi kuona mtu akishutumiwa kwa kuandika vizuri sana… ndio. Hilo hutokea. Na ni ukatili.

Alama ya kigunduzi inapaswa kutibiwa kama ifuatavyo:

kengele ya moshi, si uamuzi wa mahakama 🔥
Inakuambia "labda angalia," si "kesi imefungwa." ( OpenAI ; Turnitin )

10) Jinsi ya kutafsiri alama za kigunduzi kama mtu mzima 🧠🙂

Hapa kuna njia ya vitendo ya kusoma matokeo:

Ikiwa kifaa kinatoa asilimia moja

Ichukulie kama ishara ya hatari kubwa:

0-30%: huenda ni ya kibinadamu au imehaririwa sana
30-70%: eneo lisiloeleweka - usidhani chochote
70-100% : kuna uwezekano mkubwa wa mifumo inayofanana na akili bandia (AI), lakini bado si uthibitisho ( Miongozo ya Turnitin )

Hata alama za juu zinaweza kuwa si sahihi, hasa kwa:

uandishi sanifu
aina fulani (muhtasari, fasili)
Uandishi wa ESL ( Liang et al. (arXiv) )

Tafuta maelezo, si nambari pekee

Vigunduzi bora hutoa:

spans zilizoangaziwa
maelezo ya vipengele (utabiri, marudio, n.k.)
vipindi vya kujiamini au lugha isiyo na uhakika ( Utafiti kuhusu Ugunduzi wa Maandishi Uliozalishwa na LLM )

Ikiwa kifaa kitakataa kuelezea chochote na kukupiga nambari kwenye paji la uso wako… Siamini. Wewe pia hupaswi kuamini.

11) Jinsi Vigunduzi vya AI Vinavyofanya Kazi: mfumo rahisi wa kiakili 🧠🧩

Ukitaka kuchukua kitu safi, tumia mfumo huu wa kiakili:

Vigunduzi vya AI hutafuta mifumo ya takwimu na mtindo inayopatikana katika maandishi yanayotengenezwa kwa mashine. ( Utafiti kuhusu Ugunduzi wa Maandishi Uliotengenezwa na LLM )
Wanalinganisha mifumo hiyo na kile walichojifunza kutokana na mifano ya mafunzo. ( Utafiti kuhusu Ugunduzi wa Maandishi Uliozalishwa na LLM )
Wanatoa nadhani kama ya uwezekano , si hadithi ya asili halisi. ( OpenAI )
Ukisiaji ni nyeti kwa aina, mada, urefu, marekebisho, na data ya mafunzo ya kigunduzi . ( Utafiti kuhusu Ugunduzi wa Maandishi Uliozalishwa na LLM )

Kwa maneno mengine, Jinsi Vigunduzi vya AI Hufanya Kazi ni kwamba "hukumu kufanana," sio uandishi. Kama kusema mtu anafanana na binamu yake. Hiyo si sawa na kipimo cha DNA ... na hata vipimo vya DNA vina kesi za ukingo.

12) Vidokezo vya vitendo vya kupunguza bendera za bahati mbaya (bila kucheza michezo) ✍️✅

Sio "jinsi ya kuwadanganya wagunduzi." Zaidi kama jinsi ya kuandika kwa njia inayoakisi uandishi halisi na kuepuka usomaji usio wa kawaida.

Ongeza maelezo maalum: majina ya dhana ulizotumia, hatua ulizochukua, mabadiliko uliyozingatia
Tumia tofauti za asili: changanya sentensi fupi na ndefu (kama wanadamu wanavyofanya wanapofikiria)
Jumuisha vikwazo halisi: mipaka ya muda, zana zilizotumika, kilichoharibika, kile ambacho ungefanya tofauti
Epuka kutumia templeti kupita kiasi: badilisha "Zaidi ya hayo" na kitu ambacho ungesema kweli
Weka rasimu na maelezo: ikiwa kuna mgogoro wowote, mchakato wa ushahidi ni muhimu zaidi kuliko hisia za ndani

Kwa kweli, utetezi bora ni tu… kuwa wa kweli. Ukweli usio kamili, si "brosha kamili" halisi.

Maelezo ya Kufunga 🧠✨

Vigunduzi vya AI vinaweza kuwa na thamani, lakini si mashine za ukweli. Ni vilinganishi vya ruwaza vilivyofunzwa kuhusu data isiyokamilika, vinavyofanya kazi katika ulimwengu ambapo mitindo ya uandishi huingiliana kila mara. ( OpenAI ; Utafiti kuhusu Ugunduzi wa Maandishi Uliozalishwa na LLM )

Kwa kifupi:

Vigunduzi hutegemea viainishaji, utata/mchanganyiko, mtindo, na wakati mwingine alama za maji 🧩 ( Utafiti kuhusu Ugunduzi wa Maandishi Uliozalishwa na LLM )
Wanakadiria "kufanana na akili bandia," sio uhakika ( OpenAI )
Chanya za uongo hutokea sana katika uandishi rasmi, wa kiufundi, au usio wa asili 😬 ( Liang et al. (arXiv) ; Turnitin )
Tumia matokeo ya kigunduzi kama kidokezo cha kukagua, si uamuzi ( Turnitin )

Na ndio… ikiwa mtu atauliza tena, Jinsi Vigunduzi vya AI Hufanya Kazi , unaweza kumwambia: "Wanadhani kulingana na mifumo - wakati mwingine ni werevu, wakati mwingine ni wapumbavu, na huwa na kikomo kila wakati." 🤖

Maswali Yanayoulizwa Mara kwa Mara

Vigunduzi vya AI hufanyaje kazi katika mazoezi?

Vigunduzi vingi vya AI havithibitishi uandishi. Vinakadiria jinsi maandishi yako yanavyofanana kwa karibu na mifumo inayozalishwa na mifumo ya lugha, kisha hutoa alama inayofanana na uwezekano. Chini ya kofia, wanaweza kutumia mifumo ya uainishaji, alama ya utabiri wa mtindo wa kutatanisha, vipengele vya mtindo, au ukaguzi wa alama ya maji. Matokeo yake yanachukuliwa vyema kama ishara ya hatari, si uamuzi wa mwisho.

Vigunduzi vya AI hutafuta ishara gani katika maandishi?

Ishara za kawaida hujumuisha utabiri (jinsi modeli "inavyoshangaza" kwa maneno yako yanayofuata), marudio katika viunzi vya sentensi, mwendo usio wa kawaida, na usemi wa jumla wenye maelezo ya chini. Zana zingine pia huchunguza alama za mitindo kama vile urefu wa sentensi, tabia za uakifishaji, na masafa ya neno-utendaji. Ishara hizi zinaweza kuingiliana na uandishi wa kibinadamu, haswa katika aina rasmi, za kitaaluma, au za kiufundi.

Kwa nini vigunduzi vya AI huashiria maandishi ya binadamu kama AI?

Chanya za uongo hutokea wakati maandishi ya binadamu yanapoonekana "laini" kitakwimu au kama kiolezo. Toni rasmi, maneno ya mtindo wa kufuata sheria, maelezo ya kiufundi, sampuli fupi, na Kiingereza kisicho cha asili vyote vinaweza kusomwa vibaya kama AI kwa sababu hupunguza tofauti. Ndiyo maana aya safi na iliyohaririwa vizuri inaweza kusababisha alama ya juu. Kigunduzi kinalinganisha kufanana, si kuthibitisha asili.

Je, vigunduzi vya kutatanisha na "kupasuka" vinaaminika?

Mbinu zinazotegemea utata zinaweza kufanya kazi wakati maandishi ni ghafi, matokeo ya AI yanayoweza kutabirika sana. Lakini ni dhaifu: vifungu vifupi vina kelele, na aina nyingi halali za binadamu zinaweza kutabirika kiasili (muhtasari, ufafanuzi, barua pepe za kampuni, miongozo). Kuhariri na kung'arisha pia kunaweza kubadilisha alama kwa kiasi kikubwa. Zana hizi zinafaa kwa upimaji wa haraka, si maamuzi ya lazima pekee yake.

Kuna tofauti gani kati ya vifaa vya kugundua uainishaji na vifaa vya stylometry?

Vigunduzi vya uainishaji hujifunza kutoka kwa seti za data zilizo na lebo za maandishi ya binadamu dhidi ya AI (na wakati mwingine mseto) na kutabiri ni ndoo gani maandishi yako yanafanana zaidi. Zana za stylometry huzingatia kuandika "alama za vidole" kama vile mifumo ya uchaguzi wa maneno, maneno ya utendaji, na ishara za usomaji, ambazo zinaweza kuwa na taarifa zaidi katika uchanganuzi wa umbo refu. Mbinu zote mbili zinakabiliwa na mabadiliko ya kikoa na zinaweza kupata shida wakati mtindo wa uandishi au mada hutofautiana na data yao ya mafunzo.

Je, alama za maji hutatua ugunduzi wa akili bandia (AI) milele?

Alama za maji zinaweza kuwa imara wakati modeli inazitumia na kigunduzi kinajua mpango wa alama za maji. Kwa kweli, si alama za maji zote za watoa huduma, na mabadiliko ya kawaida - kufafanua, kutafsiri, kunukuu sehemu, au kuchanganya vyanzo - vinaweza kudhoofisha au kuvunja muundo. Ugunduzi wa alama za maji una nguvu katika hali finyu ambapo mnyororo mzima unajipanga, lakini sio chanjo ya ulimwengu wote.

Ninawezaje kutafsiri alama ya "X% AI"?

Chukulia asilimia moja kama kiashiria cha jumla cha "Ulinganifu wa AI," si uthibitisho wa uandishi wa AI. Alama za masafa ya kati zina utata hasa, na hata alama za juu zinaweza kuwa na makosa katika uandishi sanifu au rasmi. Zana bora hutoa maelezo kama vile spans zilizoangaziwa, maelezo ya vipengele, na lugha isiyo na uhakika. Ikiwa kigunduzi hakitajieleza, usichukulie nambari hiyo kama yenye mamlaka.

Ni nini kinachofanya ugunduzi mzuri wa akili bandia kwa shule au kazi za uhariri?

Kigunduzi imara hurekebishwa, hupunguza matokeo chanya ya uongo, na huwasilisha mipaka kwa uwazi. Kinapaswa kuepuka madai ya kujiamini kupita kiasi kwenye sampuli fupi, kushughulikia nyanja tofauti (kitaaluma dhidi ya blogu dhidi ya kiufundi), na kubaki imara wanadamu wanaporekebisha maandishi. Zana zinazowajibika zaidi hutenda kwa unyenyekevu: hutoa ushahidi na kutokuwa na uhakika badala ya kutenda kama wasomaji wa akili.

Ninawezaje kupunguza bendera za AI bila mpangilio bila "kucheza" mfumo?

Zingatia ishara halisi za uandishi badala ya mbinu. Ongeza maelezo maalum (hatua ulizochukua, vikwazo, mabadiliko), badilisha mdundo wa sentensi kiasili, na epuka mabadiliko yaliyopangwa kupita kiasi ambayo hungetumia kwa kawaida. Weka rasimu, madokezo, na historia ya marekebisho - ushahidi wa mchakato mara nyingi ni muhimu zaidi ya alama ya kigunduzi katika mizozo. Lengo ni uwazi na utu, si nathari kamilifu ya brosha.

Marejeleo

Chama cha Isimu za Kompyuta (Mkusanyiko wa ACL) - Utafiti kuhusu Ugunduzi wa Maandishi Uliozalishwa na LLM - aclanthology.org
OpenAI - Kiainishaji kipya cha AI cha kuonyesha maandishi yaliyoandikwa na AI - openai.com
Miongozo ya Turnitin - Ugunduzi wa uandishi wa AI katika mwonekano wa ripoti ya kawaida - guides.turnitin.com
Miongozo ya Turnitin - modeli ya kugundua uandishi wa AI - guides.turnitin.com
Turnitin - Kuelewa chanya zisizo sahihi ndani ya uwezo wetu wa kugundua uandishi wa AI - turnitin.com
arXiv - GunduaGPT - arxiv.org
Chuo Kikuu cha Boston - Machapisho ya Kuchanganyikiwa - cs.bu.edu
GPTZero - Kuchanganyikiwa na kupasuka: ni nini? - gptzero.me
PubMed Central (NCBI) - Stylometry na sayansi ya uchunguzi wa kimatibabu: Mapitio ya fasihi - ncbi.nlm.nih.gov
Chama cha Isimu za Kompyuta (Mkusanyiko wa ACL) - Maneno ya Utendaji katika Sifa za Uandishi - aclanthology.org
arXiv - Alama ya Maji kwa Mifano Mikubwa ya Lugha - arxiv.org
Google AI kwa Wasanidi Programu - Maandishi ya SynthID - ai.google.dev
arXiv - Kuhusu Utegemezi wa Alama za Maji kwa Mifano Mikubwa ya Lugha - arxiv.org
OpenAI - Kuelewa chanzo cha kile tunachokiona na kusikia mtandaoni - openai.com
Stanford HAI - Vigunduzi vya AI Vilivyopendelea Waandishi wa Kiingereza Wasio Wazawa - hai.stanford.edu
arXiv - Liang na wenzake - arxiv.org

Pata Akili ya Kielektroniki ya Hivi Punde katika Duka Rasmi la Msaidizi wa Akili ya Kielektroniki

Kuhusu Sisi

Rudi kwenye blogu