AI hupata wapi taarifa kutoka

AI hupata wapi taarifa zake?

Umewahi kukaa hapo ukikuna kichwa chako, kama... vitu hivi vinatoka wapi hasa ? Namaanisha, AI haipitii kwenye maktaba zenye vumbi au kuzidisha kaptura za YouTube kwa hila. Lakini kwa namna fulani hutoa majibu ya kila kitu - kuanzia lasagna hacks hadi fizikia ya shimo nyeusi - kana kwamba ina kabati la kuhifadhi faili lisilo na mwisho ndani. Ukweli ni wa ajabu zaidi, na labda wa kuvutia zaidi kuliko unavyodhani. Hebu tuichambue kidogo (na ndio, labda tuvunje hadithi kadhaa njiani).


Je, ni Uchawi? 🌐

Sio uchawi, ingawa wakati mwingine huhisi hivyo. Kinachotokea chini ya kifuniko kimsingi ni utabiri wa muundo . Mifano mikubwa ya lugha (LLM) haihifadhi ukweli jinsi ubongo wako unavyoshikilia mapishi ya biskuti ya bibi yako; badala yake, wamefunzwa kukisia neno linalofuata (ishara) kulingana na kile kilichotangulia [2]. Kwa vitendo, hiyo inamaanisha wanashikilia uhusiano: ni maneno gani yanayounganishwa pamoja, jinsi sentensi kawaida huchukua umbo, jinsi mawazo mazima yanavyojengwa kama jukwaa. Ndiyo maana matokeo yanasikika sawa, ingawa - uaminifu kamili - ni uigaji wa takwimu, sio uelewa [4].

Kwa hivyo ni nini hasa hufanya taarifa zinazozalishwa na AI kuwa muhimu ? Mambo machache:

  • Utofauti wa data - kutoka vyanzo vingi, si mkondo mmoja mwembamba.

  • Masasisho - bila mizunguko ya kuonyesha upya, huisha haraka.

  • Kuchuja - ikiwezekana kukamata takataka kabla hazijaingia (ingawa, tuwe wakweli, wavu huo una mashimo).

  • Kuangalia kwa makini - kutegemea vyanzo vya mamlaka (fikiria NASA, WHO, vyuo vikuu vikuu), jambo ambalo ni lazima liwepo katika vitabu vingi vya usimamizi wa akili bandia [3].

Hata hivyo, wakati mwingine hubuni—kwa kujiamini. Hizo zinazoitwa ndoto za usiku ? Kimsingi upuuzi uliosafishwa hutolewa kwa uso ulionyooka [2][3].

Makala unayoweza kupenda kusoma baada ya hii:

🔗 Je, AI inaweza kutabiri nambari za bahati nasibu?
Kuchunguza hadithi na ukweli kuhusu utabiri wa bahati nasibu ya AI.

🔗 Inamaanisha nini kuchukua mbinu kamili ya AI?
Kuelewa AI kwa mitazamo iliyosawazishwa kuhusu maadili na athari.

🔗 Biblia inasema nini kuhusu akili bandia?
Kuchunguza mitazamo ya kibiblia kuhusu teknolojia na uumbaji wa mwanadamu.


Ulinganisho wa Haraka: Ambapo AI Hutoka 📊

Sio kila chanzo ni sawa, lakini kila chanzo kina jukumu lake. Hapa kuna mwonekano wa picha.

Aina ya Chanzo Nani Anayeitumia (AI) Gharama/Thamani Kwa Nini Inafanya Kazi (au Haifanyi Kazi...)
Vitabu na Makala Mifumo mikubwa ya lugha Isiyo na thamani (ish) Maarifa mnene na yaliyopangwa vizuri - huzeeka haraka.
Tovuti na Blogu Karibu akili bandia zote Bure (na kelele) Aina mbalimbali za porini; mchanganyiko wa uzuri na takataka kabisa.
Karatasi za Kielimu AI nzito za utafiti Wakati mwingine hulipwa Ukali + uaminifu, lakini umejikita katika msamiati mzito.
Data ya Mtumiaji AI zilizobinafsishwa Ni nyeti sana ⚠️ Ushonaji mkali, lakini faragha inasumbua sana.
Mtandao wa Wakati Halisi AI zilizounganishwa na utafutaji Bure (ikiwa mtandaoni) Huweka taarifa mpya; ubaya wake ni hatari ya kuongeza uvumi.

Ulimwengu wa Data ya Mafunzo 🌌

Hii ni awamu ya "kujifunza utotoni". Hebu fikiria kumpatia mtoto mamilioni ya vitabu vya hadithi, vipande vya habari, na mashimo ya sungura ya Wikipedia yote kwa wakati mmoja. Hivyo ndivyo mafunzo ya awali yanavyoonekana. Katika ulimwengu halisi, watoa huduma hukusanya data inayopatikana hadharani, vyanzo vilivyoidhinishwa, na maandishi yanayotokana na mkufunzi [2].

Imepangwa juu: mifano ya kibinadamu iliyopangwa-majibu mazuri, majibu mabaya, kusukumwa kuelekea upande sahihi-kabla hata ya uimarishaji kuanza [1].

Tahadhari ya Uwazi: makampuni hayafichui kila undani. Baadhi ya ulinzi ni usiri (IP, masuala ya usalama), kwa hivyo unapata dirisha la sehemu tu katika mchanganyiko halisi [2].


Utafutaji wa Wakati Halisi: Kitoweo cha Ziada 🍒

Baadhi ya mifumo sasa inaweza kuchungulia nje ya kiputo chao cha mafunzo. Hiyo ni kizazi kilichoongezwa nguvu cha urejeshaji (RAG) - kimsingi ikivuta vipande kutoka kwa faharasa ya moja kwa moja au duka la hati, kisha kuviunganisha kwenye jibu [5]. Inafaa kwa vitu vinavyobadilika haraka kama vichwa vya habari au bei za hisa.

Ubaya? Intaneti ni sawa na fikra na moto wa takataka. Ikiwa vichujio au ukaguzi wa chanzo ni dhaifu, una hatari ya kuficha data taka - haswa kile ambacho mifumo ya hatari inaonya kuhusu [3].

Suluhisho la kawaida: makampuni huunganisha mifumo kwenye zao za ndani, kwa hivyo majibu hutaja sera ya sasa ya HR au hati ya bidhaa iliyosasishwa badala ya kuibadilisha. Fikiria: muda mfupi wa "uh-oh", majibu ya kuaminika zaidi.


Urekebishaji Bora: Hatua ya Kung'arisha ya AI 🧪

Mifumo mbichi iliyofunzwa mapema ni migumu. Kwa hivyo hurekebishwa vizuri :

  • Kuwafundisha kuwa na msaada, wasio na madhara, waaminifu (kupitia ujifunzaji wa kuimarisha kutoka kwa maoni ya kibinadamu, RLHF) [1].

  • Kupunguza kingo zisizo salama au zenye sumu (mpangilio) [1].

  • Kurekebisha sauti—iwe ni ya kirafiki, rasmi, au ya kejeli ya mchezo.

Sio kung'arisha almasi bali pia kugeuza maporomoko ya takwimu kuwa tabia kama mwenza wa mazungumzo.


Mapungufu na Kushindwa 🚧

Tusijifanye kuwa haina dosari:

  • Ndoto zisizoeleweka - majibu ya moja kwa moja ambayo hayana ukweli wowote [2][3].

  • Upendeleo - huakisi mifumo iliyochongwa kwenye data; inaweza hata kuikuza ikiwa haijadhibitiwa [3][4].

  • Hakuna uzoefu wa moja kwa moja - inaweza kuzungumzia mapishi ya supu lakini haijawahi kuonja hata moja [4].

  • Kujiamini kupita kiasi - nathari hutiririka kama inavyojua, hata kama haijui. Mifumo ya hatari husisitiza mawazo yanayoashiria [3].


Kwa Nini Inahisi Kama Kujua 🧠

Haina imani, haina kumbukumbu katika maana ya kibinadamu, na hakika haina nafsi. Lakini kwa sababu inaunganisha sentensi pamoja vizuri, ubongo wako unaisoma kana kwamba inaelewa . Kinachotokea ni utabiri mkubwa wa ishara inayofuata : kuhesabu matrilioni ya uwezekano katika sekunde za mgawanyiko [2].

Mtazamo wa "akili" ni tabia inayojitokeza - watafiti wanaiita, kwa lugha moja, athari ya "kasuku wa stochastic" [4].


Mfano Unaofaa kwa Watoto 🎨

Hebu fikiria kasuku ambaye amesoma kila kitabu kwenye maktaba. Haelewi hadithi lakini anaweza kuchanganya maneno na kuyafanya kuwa kitu kinachohisi busara. Wakati mwingine ni sahihi; wakati mwingine ni upuuzi - lakini kwa ustadi wa kutosha, huwezi kutofautisha kila wakati.


Kumalizia: Taarifa za AI Zinatoka Wapi 📌

Kwa maneno rahisi:

  • Data kubwa ya mafunzo (ya umma + yenye leseni + inayozalishwa na mkufunzi) [2].

  • Kurekebisha kwa kutumia maoni ya binadamu ili kuunda sauti/tabia [1].

  • Mifumo ya kurejesha data inapounganishwa kwenye mitiririko ya data ya moja kwa moja [5].

AI "haijui" mambo - inatabiri maandishi . Hiyo ndiyo nguvu yake kuu na kisigino chake cha Achilles. Jambo la msingi? Daima angalia vitu muhimu dhidi ya chanzo kinachoaminika [3].


Marejeleo

  1. Ouyang, L. et al. (2022). Kufundisha mifumo ya lugha kufuata maagizo yenye maoni ya kibinadamu (InstructGPT) . arXiv .

  2. OpenAI (2023). Ripoti ya Kiufundi ya GPT-4 - mchanganyiko wa data iliyoidhinishwa, ya umma, na iliyoundwa na binadamu; lengo na mapungufu ya utabiri wa tokeni inayofuata. arXiv .

  3. NIST (2023). Mfumo wa Usimamizi wa Hatari wa AI (AI RMF 1.0) - asili, uaminifu, na udhibiti wa hatari. PDF .

  4. Bender, EM, Gebru, T., McMillan-Major, A., Mitchell, S. (2021). Kuhusu Hatari za Kasuku Wasio na Tabia: Je, Mifano ya Lugha Inaweza Kuwa Kubwa Sana? PDF .

  5. Lewis, P. et al. (2020). Kizazi Kilichoongezwa Urejeshaji kwa NLP Yenye Maarifa Mengi . arXiv .


Pata AI ya Hivi Punde kwenye Duka Rasmi la Msaidizi wa AI

Kuhusu Sisi

Rudi kwenye blogu