AI ya chanzo huria ni nini?

AI ya Chanzo Huria ni nini?

Open Source AI inazungumzwa kama ufunguo wa kichawi ambao hufungua kila kitu. Siyo. Lakini ni njia ya vitendo na nyepesi ya kuunda mifumo ya AI unaweza kuelewa, kuboresha, na kusafirisha bila kumwomba muuzaji kugeuza swichi. Ikiwa umejiuliza ni nini kinachohesabiwa kuwa "wazi," uuzaji ni nini, na jinsi ya kuitumia kazini, uko mahali pazuri. Kunyakua kahawa - hii itakuwa muhimu, na labda maoni kidogo ☕🙂.

Makala ambazo unaweza kupenda kusoma baada ya hii:

🔗 Jinsi ya kuingiza AI katika biashara yako
Hatua za vitendo za kuunganisha zana za AI kwa ukuaji wa biashara nadhifu.

🔗 Jinsi ya kutumia akili bandia (AI) ili kuwa na tija zaidi
Gundua njia bora za kazi za AI zinazookoa muda na kuongeza ufanisi.

🔗 Ujuzi wa AI ni nini?
Jifunze ujuzi muhimu wa akili bandia (AI) muhimu kwa wataalamu walio tayari kwa siku zijazo.

🔗 Google Vertex AI ni nini?
Elewa Vertex AI ya Google na jinsi inavyorahisisha ujifunzaji wa mashine.


Open Source AI ni nini? 🤖🔓

Kwa urahisi zaidi, AI ya Chanzo Huria inamaanisha viambato vya mfumo wa AI—msimbo, uzani wa modeli, mabomba ya data, hati za mafunzo, na uhifadhi—hutolewa chini ya leseni zinazoruhusu mtu yeyote kuzitumia, kuzisoma, kuzirekebisha na kuzishiriki, kulingana na masharti yanayokubalika. Lugha hiyo ya msingi ya uhuru inatokana na Ufafanuzi wa Chanzo Huria na kanuni zake za muda mrefu za uhuru wa mtumiaji [1]. Mtazamo wa AI ni kwamba kuna viungo zaidi ya kanuni tu.

Baadhi ya miradi huchapisha kila kitu: msimbo, vyanzo vya data vya mafunzo, mapishi, na muundo uliofunzwa. Wengine hutoa tu uzani kwa leseni maalum. Mfumo ikolojia hutumia mkato mwepesi wakati mwingine, kwa hivyo tuupange vizuri katika sehemu inayofuata.


Chanzo Huria AI dhidi ya uzani wazi dhidi ya ufikiaji wazi 😅

Hapa ndipo watu wanazungumza kupita kila mmoja.

  • Chanzo Huria AI - Mradi unafuata kanuni za chanzo huria kwenye safu yake yote. Msimbo uko chini ya leseni iliyoidhinishwa na OSI, na masharti ya usambazaji yanaruhusu matumizi mapana, urekebishaji na kushiriki. Roho hapa inaakisi kile OSI inaelezea: uhuru wa mtumiaji huja kwanza [1][2].

  • Vipimo vya wazi - Vipimo vya modeli vilivyofunzwa vinaweza kupakuliwa (mara nyingi bila malipo) lakini chini ya masharti yaliyowekwa. Utaona masharti ya matumizi, vikomo vya ugawaji upya, au sheria za kuripoti. Familia ya Meta's Llama inaonyesha hili: mfumo ikolojia wa msimbo uko wazi, lakini uzani wa kielelezo husafirishwa chini ya leseni mahususi yenye masharti ya matumizi [4].

  • Fungua ufikiaji - Unaweza kugonga API, labda bila malipo, lakini haupati uzani. Inasaidia kwa majaribio, lakini si chanzo huria.

Hii sio semantiki tu. Haki na hatari zako hubadilika katika kategoria hizi. Kazi ya sasa ya OSI kuhusu AI na uwazi hufunua nuances hizi kwa lugha rahisi [2].


Ni nini hufanya Open Source AI kuwa nzuri ✅

Hebu tuwe haraka na waaminifu.

  • Uwezo wa kukaguliwa - Unaweza kusoma msimbo, kukagua mapishi ya data, na kufuatilia hatua za mafunzo. Hiyo husaidia kwa kufuata, hakiki za usalama, na udadisi wa kizamani. Mfumo wa Usimamizi wa Hatari wa NIST AI unahimiza uhifadhi wa hati na desturi za uwazi ambazo miradi iliyofunguliwa inaweza kukidhi kwa urahisi zaidi [3].

  • Kubadilika - Hujawekwa kwenye ramani ya barabara ya muuzaji. Uma. Weka kiraka. Isafirishe. Lego, sio plastiki ya glued.

  • Udhibiti wa gharama - Mwenyeji mwenyewe wakati ni nafuu. Kupasuka kwa wingu wakati sivyo. Changanya na ulinganishe maunzi.

  • Kasi ya jumuiya - Hitilafu hurekebishwa, huangazia ardhi, na unajifunza kutoka kwa wenzako. Mchafu? Wakati mwingine. Una tija? Mara nyingi.

  • Uwazi wa utawala - Leseni za kweli za wazi zinaweza kutabirika. Linganisha hilo na Sheria na Masharti ya API ambayo hubadilika kimya kimya siku ya Jumanne.

Je, ni kamili? Hapana. Lakini ubadilishanaji unasomeka - zaidi ya unavyopata kutoka kwa huduma nyingi za sanduku nyeusi.


Rafu ya Open Source AI: msimbo, uzani, data na gundi 🧩

Fikiria mradi wa AI kama lasagna ya quirky. Tabaka kila mahali.

  1. Mifumo na nyakati za uendeshaji — Vifaa vya kufafanua, kutoa mafunzo na kuhudumia miundo (km, PyTorch, TensorFlow). Jumuiya na hati zenye afya ni muhimu zaidi kuliko majina ya chapa.

  2. Miundo ya usanifu - Mchoro: transfoma, mifano ya uenezi, usanidi wa kurejesha-augmented.

  3. Uzito - Vigezo vilivyojifunza wakati wa mafunzo. "Fungua" hapa inategemea ugawaji upya na haki za matumizi ya kibiashara, sio tu upakuaji.

  4. Data na mapishi - Hati za ugawaji, vichungi, nyongeza, ratiba za mafunzo. Uwazi hapa ni dhahabu kwa ajili ya kuzaliana.

  5. Vifaa na upangaji - Seva za uelekezaji, hifadhidata za vekta, viunga vya tathmini, uangalizi, CI/CD.

  6. Utoaji leseni - Uti wa mgongo tulivu ambao huamua kile unachoweza kufanya. Zaidi hapa chini.


Utoaji leseni 101 kwa Chanzo Huria AI 📜

Huna haja ya kuwa mwanasheria. Unahitaji kuona mifumo.

  • Leseni za msimbo unaoruhusiwa - MIT, BSD, Apache-2.0. Apache inajumuisha ruzuku ya wazi ya hataza ambayo timu nyingi huthamini [1].

  • Copyleft - Familia ya GPL inahitaji derivatives kubaki wazi chini ya leseni sawa. Nguvu, lakini ipange katika usanifu wako.

  • Leseni za modeli mahususi - Kwa uzani na seti za data, utaona leseni maalum kama vile familia ya Leseni ya AI inayowajibika (OpenRAIL). Hizi husimba vibali na vikwazo vinavyotokana na matumizi; baadhi huruhusu matumizi ya kibiashara kwa upana, wengine huongeza ulinzi kuhusu matumizi mabaya [5].

  • Creative Commons kwa data - CC-BY au CC0 ni ya kawaida kwa seti za data na hati. Uwasilishaji unaweza kudhibitiwa kwa kiwango kidogo; jenga muundo mapema.

Kidokezo cha Kitaalam: Weka ukurasa mmoja unaoorodhesha kila tegemezi, leseni yake, na ikiwa ugawaji upya wa kibiashara unaruhusiwa. Inachosha? Ndiyo. Je, ni lazima? Pia ndiyo.


Jedwali la kulinganisha: miradi maarufu ya Open Source AI na inapong'aa 📊

upole messy kwa makusudi - hivyo ndivyo noti halisi kuangalia

Zana / Mradi Ni kwa ajili ya nani Bei ya juu Kwa nini inafanya kazi vizuri
PyTorch Watafiti, wahandisi Bure Grafu zinazobadilika, jumuiya kubwa, hati dhabiti. Vita iliyojaribiwa katika prod.
Mtiririko wa Tensor Timu za biashara, utendaji wa ML Bure Hali ya grafu, TF-Serving, kina cha mfumo ikolojia. Kujifunza kwa kasi kwa wengine, bado ni thabiti.
Vibadilishaji vya Uso Vinavyokumbatiana Wajenzi na tarehe za mwisho Bure Miundo iliyofunzwa awali, mabomba, seti za data, urekebishaji kwa urahisi. Kusema kweli njia ya mkato.
vLLM Timu zinazozingatia infra-minded Bure Inatumika kwa LLM haraka, akiba ya KV yenye ufanisi, upitishaji thabiti kwenye GPU za kawaida.
Llama.cpp Tinkers, vifaa vya makali Bure Endesha miundo ya ndani kwenye kompyuta za mkononi na simu zenye ujanibishaji.
LangChain Wasanidi wa programu, prototypes Bure Minyororo inayoweza kutungwa, viunganishi, mawakala. Ushindi wa haraka ikiwa utaiweka rahisi.
Usambazaji Imara Wabunifu, timu za bidhaa Uzito wa bure Uzalishaji wa picha ndani au wingu; mtiririko mkubwa wa kazi na UI karibu nayo.
Ollama Wasanidi wanaopenda CLI za karibu Bure Vuta-na-endesha mifano ya ndani. Leseni hutofautiana kulingana na kadi ya kielelezo-tazama hiyo.

Ndiyo, "Bure" nyingi. Kupangisha, GPU, hifadhi, na saa za watu si bure.


Jinsi makampuni hutumia Open Source AI kazini 🏢⚙️

Utasikia mambo mawili yaliyokithiri: ama kila mtu anapaswa kujipangia kila kitu, au mtu yeyote asifanye. Maisha ya kweli ni squishier.

  1. Kuchapa haraka - Anza na miundo wazi inayoruhusiwa ili kuthibitisha UX na athari. Refactor baadaye.

  2. Huduma mseto - Weka kielelezo kilichopangishwa na VPC au kwenye mtandao kwa simu ambazo ni nyeti kwa faragha. Rudi kwenye API iliyopangishwa kwa mzigo wa mkia mrefu au mnene. Kawaida sana.

  3. Fanya vizuri kwa kazi finyu - Marekebisho ya kikoa mara nyingi hushinda mizani ghafi.

  4. RAG kila mahali - Kizazi kilichoboreshwa na urejeshaji hupunguza ndoto kwa kuweka majibu katika data yako. Fungua vekta DB na adapta hufanya hii iweze kufikiwa.

  5. Makali na nje ya mtandao - Miundo nyepesi iliyokusanywa kwa ajili ya kompyuta za mkononi, simu au vivinjari kupanua nyuso za bidhaa.

  6. Uzingatiaji na ukaguzi - Kwa sababu unaweza kukagua matumbo, wakaguzi wana kitu madhubuti cha kukagua. Oanisha hiyo na sera inayowajibika ya AI ambayo inaelekeza kwa kategoria za NIST za RMF na mwongozo wa hati [3].

Dokezo dogo la uga: Timu ya SaaS yenye nia ya faragha ambayo nimeona (soko la kati, watumiaji wa Umoja wa Ulaya) wamepitisha usanidi wa mseto: muundo mdogo wazi katika VPC kwa 80% ya maombi; burst kwa API iliyopangishwa kwa vidokezo adimu, vya muktadha mrefu. Walipunguza muda wa kusubiri kwa njia ya kawaida na kurahisisha makaratasi ya DPIA—bila kuchemsha bahari.


Hatari na malengo unayopaswa kuyapanga 🧨

Tuwe watu wazima kuhusu hili.

  • Utelezi wa leseni - Repo huanza MIT, kisha uzani huhamia kwa leseni maalum. Sasisha rejista yako ya ndani au utasafirisha mshangao wa utiifu [2][4][5].

  • Upatikanaji wa data - Data ya mafunzo yenye haki zisizoeleweka inaweza kutiririka katika miundo. Fuatilia vyanzo na ufuate leseni za seti ya data, si mitetemo [5].

  • Usalama - Tibu vizalia vya programu kama vile msururu mwingine wowote wa ugavi: hundi, matoleo yaliyotiwa saini, SOM. Hata SECURITY.md kidogo hushinda ukimya.

  • Tofauti za ubora - Miundo ya wazi hutofautiana sana. Tathmini kwa kazi zako, sio tu bao za wanaoongoza.

  • Gharama iliyofichwa ya infra - Maoni ya haraka yanataka GPU, ujanibishaji, batching, akiba. Fungua msaada wa zana; bado unalipa kwa hesabu.

  • Deni la Utawala - Ikiwa hakuna mtu anayemiliki mzunguko wa maisha, unapata tambi za usanidi. Orodha nyepesi ya MLOps ni dhahabu.


Kuchagua kiwango cha uwazi kinachofaa kwa matumizi yako 🧭

Njia ya uamuzi potofu kidogo:

  • Je, unahitaji kusafirisha haraka na mahitaji ya kufuata mwanga? Anza na mifano ya wazi inayoruhusiwa, urekebishaji mdogo, huduma ya wingu.

  • unahitaji faragha au operesheni ya nje ya mtandao Chagua bunda la wazi linaloauniwa vyema, makisio ya mwenyeji binafsi, na kagua leseni kwa makini.

  • Je, unahitaji haki pana za kibiashara na ugawaji upya? Pendelea leseni za msimbo zilizooanishwa na OSI pamoja na leseni za muundo ambazo zinaruhusu kwa uwazi matumizi ya kibiashara na ugawaji upya [1][5].

  • unahitaji kubadilika kwa utafiti ? Nenda kutoka-mwisho hadi mwisho unaoruhusiwa, ikijumuisha data, kwa ajili ya kuzaliana na kushirikiwa.

  • Je, huna uhakika? Majaribio yote mawili. Njia moja itahisi vizuri zaidi katika wiki.


Jinsi ya kutathmini mradi wa Open Source AI kama mtaalamu 🔍

Orodha ya ukaguzi ya haraka ninayoweka, wakati mwingine kwenye leso.

  1. Uwazi wa leseni - imeidhinishwa na OSI kwa msimbo? Vipi kuhusu uzito na data? Vizuizi vyovyote vya utumiaji ambavyo huzuia mtindo wako wa biashara [1][2][5]?

  2. Nyaraka - Sakinisha, anza haraka, mifano, utatuzi wa shida. Hati ni habari za kitamaduni.

  3. Mwanguko wa kutolewa - Matoleo yaliyotambulishwa na orodha za mabadiliko zinapendekeza uthabiti; msukumo wa hapa na pale unapendekeza ushujaa.

  4. Vigezo na viwango - Majukumu ni ya kweli? Evals inaweza kukimbia?

  5. Matengenezo na utawala - Futa wamiliki wa misimbo, utatuzi wa suala, uwajibikaji wa PR.

  6. Ecosystem fit - Hucheza vyema na maunzi yako, maduka ya data, ukataji miti, auth.

  7. Mkao wa usalama - Vizalia vilivyotiwa saini, skanning ya utegemezi, utunzaji wa CVE.

  8. Ishara ya jumuiya - Majadiliano, majibu ya jukwaa, repo za mfano.

Kwa upatanishi mpana na mazoea ya kuaminika, panga mchakato wako kwa kategoria za NIST AI RMF na vizalia vya programu vya hati [3].


Kupiga mbizi kwa kina 1: katikati yenye fujo ya leseni za muundo 🧪

Baadhi ya mifano yenye uwezo zaidi huishi kwenye ndoo ya "uzito wazi na masharti". Zinafikiwa, lakini kwa vikomo vya matumizi au sheria za ugawaji upya. Hiyo inaweza kuwa sawa ikiwa bidhaa yako haitegemei kuweka upya muundo au kusafirisha katika mazingira ya wateja. Ikiwa unahitaji hiyo, jadiliana au uchague msingi tofauti. Jambo kuu ni kupanga mipango yako halisi ya leseni, sio chapisho la blogi [4][5].

Leseni za mtindo wa OpenRAIL hujaribu kuleta usawa: kuhimiza utafiti wazi na kushiriki, huku ukikatisha matumizi mabaya. Nia ni nzuri; wajibu bado ni wako. Soma sheria na uamue ikiwa masharti yanalingana na hamu yako ya hatari [5].


Kupiga mbizi kwa kina 2: uwazi wa data na hekaya ya kuzaliana 🧬

"Bila utupaji kamili wa data, Open Source AI ni bandia." Sio kabisa. Asili ya data na mapishi yanaweza kutoa uwazi wa maana hata wakati baadhi ya seti mbichi za data zimewekewa vikwazo. Unaweza kuweka kumbukumbu za vichujio, uwiano wa sampuli, na usafishaji wa maandishi vizuri vya kutosha kwa timu nyingine kukadiria matokeo. Uzalishaji kamili ni mzuri. Uwazi unaoweza kutekelezeka mara nyingi unatosha [3][5].

Wakati hifadhidata zimefunguliwa, ladha za Creative Commons kama CC-BY au CC0 ni za kawaida. Uwasilishaji kwa kiwango unaweza kupata shida, kwa hivyo sawazisha jinsi unavyoishughulikia mapema.


Kupiga mbizi kwa kina 3: MLOps za vitendo kwa miundo iliyo wazi 🚢

Kusafirisha muundo wazi ni kama kusafirisha huduma yoyote, pamoja na mambo machache.

  • Safu ya huduma - Seva za uelekezaji maalum huboresha upangaji, usimamizi wa kache ya KV, na utiririshaji wa ishara.

  • Ukadiriaji - Vipimo vidogo → makisio ya bei nafuu na uwekaji wa makali kwa urahisi. Ubora wa biashara hutofautiana; pima na zako .

  • Kuzingatiwa - Vidokezo vya kumbukumbu/matokeo kwa kuzingatia faragha. Sampuli ya tathmini. Ongeza ukaguzi wa drift kama ungefanya kwa ML ya kitamaduni.

  • Sasisho - Miundo inaweza kubadilisha tabia kwa hila; tumia canaries na uhifadhi kumbukumbu kwa urejeshaji na ukaguzi.

  • Eval harness - Dumisha safu maalum ya kazi maalum, sio tu alama za jumla. Jumuisha vidokezo vya wapinzani na bajeti za kusubiri.


Mchoro mdogo: kutoka sifuri hadi majaribio inayoweza kutumika katika hatua 10 🗺️

  1. Bainisha kazi moja nyembamba na kipimo. Bado hakuna majukwaa makubwa.

  2. Chagua kielelezo cha msingi ambacho kinatumika sana na kilichorekodiwa vyema.

  3. Simama uelekezaji wa ndani na API nyembamba ya kanga. Weka boring.

  4. Ongeza urejeshaji kwa matokeo ya msingi kwenye data yako.

  5. Andaa seti ndogo ya eval iliyo na lebo ambayo inaonyesha watumiaji wako, warts na wote.

  6. Tunga vizuri au tune haraka ikiwa tu eval anasema unapaswa.

  7. Thibitisha ikiwa muda wa kusubiri au unapunguza gharama. Pima tena ubora.

  8. Ongeza kumbukumbu, vidokezo vya kushirikiana na sera ya matumizi mabaya.

  9. Lango lenye bendera ya kipengele na kutolewa kwa kundi dogo.

  10. Iterate. Safisha maboresho madogo kila wiki… au wakati ni bora zaidi.


Hadithi za kawaida kuhusu Open Source AI, zimetatuliwa kidogo 🧱

  • Hadithi: mifano ya wazi daima ni mbaya zaidi. Ukweli: kwa kazi zinazolengwa zilizo na data sahihi, miundo iliyopangwa vizuri inaweza kuwa bora zaidi kuliko zile kubwa zaidi zilizopangishwa.

  • Hadithi: wazi inamaanisha kutokuwa na usalama. Ukweli: uwazi unaweza kuboresha uchunguzi. Usalama unategemea mazoea, si usiri [3].

  • Hadithi: leseni haijalishi ikiwa ni bure. Ukweli: ni muhimu zaidi wakati ni bure, kwa sababu matumizi ya mizani ya bure. Unataka haki zilizo wazi, sio mitetemo [1][5].


Chanzo Huria AI 🧠✨

Open Source AI sio dini. Ni seti ya uhuru wa kivitendo unaokuruhusu ujenge kwa udhibiti zaidi, utawala ulio wazi zaidi, na kurudia kwa haraka. Mtu anaposema muundo "umefunguliwa," uliza ni safu zipi zimefunguliwa: msimbo, uzani, data, au ufikiaji tu. Soma leseni. Linganisha na kesi yako ya utumiaji. Na kisha, muhimu, ijaribu na mzigo wako halisi wa kazi.

Sehemu bora zaidi, isiyo ya kawaida, ni ya kitamaduni: miradi wazi hualika michango na uchunguzi, ambao unaelekea kufanya programu na watu kuwa bora zaidi. Huenda ukagundua kuwa hatua iliyoshinda si modeli kuu zaidi au alama bora zaidi, lakini ile ambayo unaweza kuelewa, kurekebisha na kuboresha wiki ijayo. Hiyo ni nguvu tulivu ya Open Source AI - si risasi ya fedha, zaidi kama zana iliyovaliwa vizuri ambayo huokoa siku.


Muda Mrefu Sijasoma 📝

Open Source AI inahusu uhuru wa maana wa kutumia, kusoma, kurekebisha na kushiriki mifumo ya AI. Inaonyesha katika tabaka: mifumo, miundo, data, na zana. Usichanganye chanzo wazi na uzani wazi au ufikiaji wazi. Angalia leseni, tathmini na kazi zako halisi, na usanifu kwa usalama na utawala kuanzia siku ya kwanza. Fanya hivyo, na utapata kasi, udhibiti, na ramani ya barabara tulivu. Inashangaza nadra, kwa uaminifu isiyo na thamani 🙃.


Marejeleo

[1] Mpango wa Open Source - Ufafanuzi wa Chanzo Huria (OSD): soma zaidi
[2] OSI - Dive Deep on AI & Openness: soma zaidi
[3] NIST - Mfumo wa Usimamizi wa Hatari wa AI: soma zaidi
[4] Meta - Leseni ya Mfano wa Llama: soma zaidi
[5] Leseni za AI zinazowajibika (OpenRAIL): soma zaidi

Pata Akili ya Kielektroniki ya Hivi Punde katika Duka Rasmi la Msaidizi wa Akili ya Kielektroniki

Kuhusu Sisi

Rudi kwenye blogu