Jibu fupi: Ili kujenga wakala wa AI anayefanya kazi kwa vitendo, ichukulie kama mzunguko unaodhibitiwa: chukua ingizo, amua hatua inayofuata, piga simu kifaa chenye upeo mdogo, angalia matokeo, na urudie hadi ukaguzi ulio wazi wa "kukamilika" upite. Itapata uangalizi wake wakati kazi ina hatua nyingi na inaendeshwa na zana; ikiwa kidokezo kimoja kitaitatua, ruka wakala. Ongeza mipango madhubuti ya zana, mipaka ya hatua, kumbukumbu, na kithibitishaji/mkosoaji ili zana zitakaposhindwa au ingizo zikiwa na utata, wakala aongeze kasi badala ya kuzunguka.
Mambo muhimu ya kuzingatia:
Kitanzi cha kidhibiti : Tekeleza ingizo→tenda→angalia marudio kwa masharti dhahiri ya kusimamisha na hatua za juu zaidi.
Ubunifu wa zana : Weka zana nyembamba, zilizoandikwa, zilizoruhusiwa, na zilizothibitishwa ili kuzuia machafuko ya "kufanya_chochote".
Usafi wa kumbukumbu : Tumia hali ya muda mfupi pamoja na urejeshaji wa muda mrefu; epuka kutupa nakala kamili.
Upinzani wa matumizi mabaya : Ongeza orodha za ruhusa, mipaka ya viwango, kutokuwa na uwezo wa kufanya maamuzi, na "kutofanya maamuzi" kwa vitendo hatarishi.
Upimaji : Dumisha mpangilio wa matukio (kushindwa, utata, sindano) na urudie kila mabadiliko.

🔗 Jinsi ya kupima utendaji wa AI
Jifunze vipimo vya vitendo ili kupima kasi, usahihi, na uaminifu.
🔗 Jinsi ya kuzungumza na AI
Tumia vidokezo, muktadha, na ufuatiliaji ili kupata majibu bora zaidi.
🔗 Jinsi ya kutathmini mifumo ya akili bandia (AI)
Linganisha mifumo kwa kutumia majaribio, rubriki, na matokeo ya kazi halisi.
🔗 Jinsi ya kuboresha mifumo ya akili bandia (AI)
Boresha ubora na gharama kwa kurekebisha, kupogoa, na kufuatilia.
1) Wakala wa akili bandia ni nini, kwa maneno ya kawaida 🧠
Wakala wa AI ni mzunguko. Hati za "Wakala" za LangChain
Ndivyo ilivyo. Kitanzi chenye ubongo katikati.
Ingizo → fikiria → tenda → tazama → rudia . Karatasi ya kutenda tena (sababu + tenda)
Wapi:
-
Ingizo ni ombi la mtumiaji au tukio (barua pepe mpya, tiketi ya usaidizi, ping ya kitambuzi).
-
Fikiria ni mfano wa lugha unaoelezea hatua inayofuata.
-
Act ni kuita kifaa (tafuta hati za ndani, endesha msimbo, unda tiketi, rasimu jibu). Mwongozo wa kupiga simu wa OpenAI Function
-
Observe inasoma matokeo ya zana.
-
Kurudia ndiyo sehemu inayoifanya ihisi kama "ya kimkakati" badala ya "ya kuzungumza". Hati za LangChain "Wakala"
Baadhi ya mawakala kimsingi ni makro mahiri. Wengine hufanya kazi zaidi kama opereta mdogo ambaye anaweza kusawazisha kazi na kupona kutokana na hitilafu. Zote zinahesabiwa.
Pia, huhitaji uhuru kamili. Kwa kweli ... labda hutaki 🙃
2) Wakati unapopaswa kujenga wakala (na wakati ambapo hupaswi) 🚦
Jenga wakala wakati:
-
Kazi ni ya hatua nyingi na hubadilika kulingana na kinachotokea katikati ya safari.
-
Kazi inahitaji matumizi ya zana (hifadhidata, CRM, utekelezaji wa msimbo, utengenezaji wa faili, vivinjari, API za ndani). Hati za "Zana" za LangChain
-
Unataka matokeo yanayoweza kurudiwa yenye vizuizi, si majibu ya mara moja tu.
-
Unaweza kufafanua "imekamilika" kwa njia ambayo kompyuta inaweza kuangalia, hata kwa njia isiyo na utaratibu.
Usijenge wakala wakati:
-
Jibu rahisi la haraka + jibu hutatua tatizo (usifanye mambo kupita kiasi, utajichukia baadaye).
-
Unahitaji uamuzi kamili (mawakala wanaweza kuwa thabiti, lakini si roboti).
-
Huna zana au data yoyote ya kuunganisha - basi kwa kiasi kikubwa ni hisia tu.
Tuwe wakweli: nusu ya "miradi ya wakala wa akili bandia" inaweza kuwa mtiririko wa kazi wenye sheria chache za matawi. Lakini, wakati mwingine hisia pia ni muhimu 🤷♂️
3) Ni nini kinachofanya toleo zuri la wakala wa akili bandia ✅
Hapa kuna sehemu ya "Ni nini kinachofanya toleo zuri la" uliyoomba, isipokuwa nitasema kwa uwazi kidogo:
Toleo zuri la wakala wa akili bandia (AI) si yule anayefikiria zaidi. Ni yule ambaye:
-
Anajua kinachoruhusiwa kufanya (mipaka ya wigo)
-
Hutumia zana kwa njia ya kuaminika (simu zilizopangwa, majaribio mapya, muda ulioisha) Mwongozo wa kupiga simu wa OpenAI Function AWS “Muda ulioisha, majaribio mapya, na kurudi nyuma kwa jitter”
-
Huweka hali safi (kumbukumbu ambayo haiozi) LangChain "Muhtasari wa kumbukumbu"
-
Inaelezea vitendo vyake (njia za ukaguzi, si hoja za siri) NIST AI RMF 1.0 (uaminifu na uwazi)
-
Husimama ipasavyo (ukaguzi kamili, hatua za juu zaidi, upandaji) Hati za "Wakala" za LangChain
-
Anashindwa salama (anaomba msaada, hadanganyi mamlaka) NIST AI RMF 1.0
-
Inaweza kujaribiwa (unaweza kuiendesha kwenye matukio ya makopo na kupata matokeo)
Ikiwa wakala wako hawezi kujaribiwa, kimsingi ni mashine ya yanayopangwa yenye ujasiri mkubwa. Inafurahisha kwenye sherehe, inatisha katika uzalishaji 😬
4) Vigezo vya msingi vya wakala ("anatomia" 🧩)
Wakala wengi imara wana vipande hivi:
A) Kitanzi cha kidhibiti 🔁
Huyu ndiye mratibu:
-
chukua lengo
-
muulize modeli kwa hatua inayofuata
-
zana ya kuendesha
-
ongeza uchunguzi
-
Rudia hadi hati za LangChain “Agents”
B) Zana (pia inajulikana kama uwezo) 🧰
Zana ndizo zinazomfanya wakala awe na ufanisi: Hati za LangChain “Zana”
-
maswali ya hifadhidata
-
kutuma barua pepe
-
kuvuta faili
-
msimbo unaoendeshwa
-
kupiga simu API za ndani
-
kuandika kwa lahajedwali au CRM
C) Kumbukumbu 🗃️
Aina mbili ni muhimu:
-
kumbukumbu ya muda mfupi : muktadha wa sasa wa utekelezaji, hatua za hivi karibuni, mpango wa sasa
-
kumbukumbu ya muda mrefu : mapendeleo ya mtumiaji, muktadha wa mradi, maarifa yaliyopatikana (mara nyingi kupitia upachikaji + duka la vekta) Karatasi ya RAG
D) Sera ya mipango na maamuzi 🧭
Hata kama huiita "kupanga", unahitaji mbinu:
-
orodha za ukaguzi
-
Karatasi ya ReAct ya mtindo wa ReAct "fikiria kisha chombo"
-
grafu za kazi
-
mifumo ya msimamizi-mfanyakazi
-
Mifumo ya msimamizi-mfanyakazi Microsoft AutoGen (mfumo wa mawakala wengi)
E) Vizuizi na tathmini 🧯
-
ruhusa
-
mipango ya zana salama Matokeo ya Muundo ya OpenAI
-
uthibitishaji wa matokeo
-
mipaka ya hatua
-
kumbukumbu
-
majaribio ya NIST AI RMF 1.0
Ndiyo, ni uhandisi zaidi kuliko kushawishi. Ambayo ni ... jambo la msingi.
5) Jedwali la Ulinganisho: njia maarufu za kujenga wakala 🧾
Hapa chini kuna "Jedwali la Ulinganisho" halisi - lenye mambo machache yasiyo ya kawaida, kwa sababu timu halisi ni za kipekee 😄
| Zana / Mfumo | Hadhira | Bei | Kwa nini inafanya kazi | Maelezo (machafuko madogo) | |
|---|---|---|---|---|---|
| LangChain | wajenzi wanaopenda vipengele vya mtindo wa lego | bure-ish + infra | mfumo mkuu wa vifaa, kumbukumbu, minyororo | inaweza kupata tambi haraka ikiwa hutaji mambo waziwazi | |
| Kielezo cha Llama | Timu zenye RAG nyingi | bure-ish + infra | mifumo imara ya urejeshaji, uorodheshaji, viunganishi | vizuri wakati wakala wako kimsingi ni "utafutaji + kitendo" ... jambo ambalo ni la kawaida | |
| Mbinu ya mtindo wa Wasaidizi wa OpenAI | timu zinazotaka usanidi wa haraka zaidi | kulingana na matumizi | Mifumo ya wito wa zana iliyojengewa ndani na hali ya uendeshaji | Haibadiliki sana katika baadhi ya pembe, lakini ni safi kwa programu nyingi | OpenAI Huendesha API ya Wasaidizi wa OpenAI wito wa kitendakazi |
| Kernel ya Semantiki | watengenezaji wanaotaka mpangilio uliopangwa | huru-ish | muhtasari mzuri wa ujuzi/majukumu | Inahisi "nadhifu ya biashara" - wakati mwingine hiyo ni pongezi 😉 | |
| AutoGen | majaribio ya mawakala wengi | huru-ish | Mifumo ya ushirikiano wa wakala kwa wakala | anaweza kuongea kupita kiasi; kuweka sheria kali za kuachisha kazi | |
| CrewAI | Mashabiki wa "timu za mawakala" | huru-ish | majukumu + kazi + makabidhiano ni rahisi kuelezea | hufanya kazi vizuri zaidi wakati kazi ni laini, si laini | |
| Nyasi | tafuta + watu wa mabomba | huru-ish | mabomba imara, urejeshaji, vipengele | "ukumbi wa maonyesho wa mawakala" kidogo, "kiwanda cha vitendo" zaidi | |
| Tembeza mwenyewe (kitanzi maalum) | watu wa kudhibiti (wenye upendo) | wakati wako | uchawi mdogo, uwazi wa hali ya juu | kwa kawaida huwa bora zaidi kwa muda mrefu… hadi utakapobuni upya kila kitu 😅 |
Hakuna mshindi mmoja. Chaguo bora linategemea kama kazi kuu ya wakala wako ni kutafuta , kutekeleza zana , uratibu wa mawakala wengi , au otomatiki ya mtiririko wa kazi .
6) Jinsi ya Kujenga Wakala wa AI hatua kwa hatua (mapishi halisi) 🍳🤖
Hii ndiyo sehemu ambayo watu wengi huipuuza, kisha wanajiuliza ni kwa nini wakala huyo ana tabia kama rakuni kwenye pantry.
Hatua ya 1: Fafanua kazi hiyo kwa sentensi moja 🎯
Mifano:
-
"Andika jibu la mteja kwa kutumia sera na muktadha wa tiketi, kisha omba idhini."
-
"Chunguza ripoti ya hitilafu, iandike tena, na upendekeze suluhisho."
-
"Badilisha maelezo yasiyokamilika ya mkutano kuwa kazi, wamiliki, na tarehe za mwisho."
Kama huwezi kuifafanua kwa urahisi, wakala wako naye hawezi. Namaanisha inaweza, lakini itabuniwa, na kubuniwa ndipo bajeti zinapokufa.
Hatua ya 2: Amua kiwango cha uhuru (cha chini, cha kati, chenye viungo) 🌶️
-
Uhuru mdogo : inapendekeza hatua, mibofyo ya kibinadamu "inakubali"
-
Kati : huendesha zana, hutoa rasimu, huongezeka kwa kutokuwa na uhakika
-
High : hutekeleza kuanzia mwanzo hadi mwisho, hupiga ping kwa wanadamu pekee kwa vighairi
Anza chini kuliko unavyotaka. Unaweza kuiongeza kasi baadaye.
Hatua ya 3: Chagua mkakati wako wa kielelezo 🧠
Kwa kawaida huchagua:
-
modeli moja imara kwa kila kitu (rahisi)
-
modeli moja imara + modeli ndogo kwa hatua za bei nafuu (uainishaji, uelekezaji)
-
mifumo maalum (maono, kanuni, usemi) ikiwa inahitajika
Pia amua:
-
tokeni za juu zaidi
-
halijoto
-
kama unaruhusu dalili ndefu za ndani (unaweza, lakini usifichue mnyororo mbichi wa mawazo kwa watumiaji wa mwisho)
Hatua ya 4: Fafanua zana kwa kutumia michoro kali 🔩
Zana zinapaswa kuwa:
-
nyembamba
-
iliyoandikwa
-
ruhusa
-
Matokeo ya Muundo wa OpenAI yaliyothibitishwa
Badala ya kifaa kinachoitwa do_anything(input: string) , tengeneza:
-
tafuta_kb(swali: mfuatano) -> matokeo[] -
tengeneza_tiketi(kichwa: mfuatano, mwili: mfuatano, kipaumbele: enum) -> kitambulisho_cha_tiketi -
send_email(kwa: kamba, mada: kamba, mwili: kamba) -> haliMwongozo wa kupiga simu wa OpenAI Function
Ukimpa wakala msumeno wa mnyororo, usishtuke anapokata ua kwa kuondoa uzio pia.
Hatua ya 5: Jenga kitanzi cha kidhibiti 🔁
Kitanzi cha chini kabisa:
-
Anza na lengo + muktadha wa awali
-
Muulize modeli: "Kitendo kinachofuata?"
-
Ikiwa simu ya zana - tekeleza zana
-
Ongeza uchunguzi
-
Angalia hali ya kusimama
-
Rudia (kwa hatua za juu zaidi) Hati za LangChain “Mawakala”
Ongeza:
-
muda wa kuisha
-
majaribio tena (kuwa mwangalifu - majaribio tena yanaweza kurudiwa) AWS “Muda unaisha, majaribio tena, na kurudi nyuma kwa jitter”
-
umbizo la hitilafu ya zana (wazi, iliyopangwa)
Hatua ya 6: Ongeza kumbukumbu kwa uangalifu 🗃️
Muda mfupi: weka "muhtasari wa hali" mdogo ukisasishwa kila hatua. LangChain "Muhtasari wa kumbukumbu"
Muda mrefu: hifadhi taarifa zinazodumu (mapendeleo ya mtumiaji, sheria za shirika, hati thabiti).
Kanuni ya kidole gumba:
-
ikiwa inabadilika mara kwa mara - iendelee kwa muda mfupi
-
ikiwa ni thabiti - duka la muda mrefu
-
ikiwa ni nyeti - hifadhi kwa kiasi kidogo (au isiwe hivyo kabisa)
Hatua ya 7: Ongeza uthibitisho na pasi ya "mkosoaji" 🧪
Muundo wa bei nafuu na wa vitendo:
-
wakala hutoa matokeo
-
kithibitishaji huangalia muundo na vikwazo
-
mapitio ya hiari ya mfumo wa wakosoaji kwa hatua zilizokosekana au ukiukaji wa sera NIST AI RMF 1.0
Sio kamili, lakini inashangaza sana.
Hatua ya 8: Andika kila kitu ambacho utajuta kutokuandika 📜
Kumbukumbu:
-
simu za zana + ingizo + matokeo
-
maamuzi yaliyofanywa
-
makosa
-
matokeo ya mwisho
-
tokeni na ucheleweshaji wa utangulizi wa OpenTelemetry
Wakati ujao - utakushukuru. Sasa - utasahau. Hayo ni maisha tu 😵💫
7) Kupiga simu kwa zana ambazo hazikuvunji roho 🧰😵
Utumiaji wa zana ndio mahali ambapo "Jinsi ya Kujenga Wakala wa AI" inakuwa uhandisi halisi wa programu.
Fanya zana ziwe za kutegemewa (kutegemewa ni nzuri)
Zana zinazotegemewa ni:
-
yenye uamuzi
-
wigo mwembamba
-
rahisi kujaribu
-
salama kuendesha tena Stripe "Maombi ya Idempotent"
Ongeza vizuizi kwenye safu ya zana, si vidokezo tu
Vidokezo ni mapendekezo ya heshima. Uthibitisho wa zana ni mlango uliofungwa. Matokeo ya Muundo wa OpenAI
Fanya:
-
orodha za vibali (zana ambazo zinaweza kutumika)
-
uthibitisho wa ingizo
-
mipaka ya viwango OpenAI Mwongozo wa mipaka ya viwango
-
ukaguzi wa ruhusa kwa kila mtumiaji/shirika
-
"Hali ya kukimbia bila kutumia nguvu" kwa vitendo hatarishi
Ubunifu wa hitilafu ya sehemu
Zana zinashindwa kufanya kazi. Mitandao inayumbayumba. Uidhinishaji unaisha muda wake. Wakala lazima:
-
kutafsiri makosa
-
Jaribu tena kwa kurudi nyuma inapohitajika mkakati wa kujaribu tena wa Google Cloud (kurudi nyuma + jitter)
-
chagua zana mbadala
-
kuongezeka wakati wa kukwama
Ujanja mzuri kimya kimya: rudisha makosa yaliyopangwa kama:
-
aina: auth_error -
aina: haipatikani -
aina: kiwango_kidogo
Kwa hivyo modeli inaweza kujibu kwa busara badala ya kuogopa.
8) Kumbukumbu inayokusaidia badala ya kukusumbua 👻🗂️
Kumbukumbu ina nguvu, lakini pia inaweza kuwa kikwazo cha takataka.
Kumbukumbu ya muda mfupi: iweke ndogo
Tumia:
-
hatua za mwisho N
-
muhtasari unaoendelea (imesasishwa kila kitanzi)
-
mpango wa sasa
-
vikwazo vya sasa (bajeti, muda, sera)
Ukiweka kila kitu katika muktadha, unapata:
-
gharama kubwa zaidi
-
ucheleweshaji wa polepole
-
mkanganyiko zaidi (ndio, hata hivyo)
Kumbukumbu ya muda mrefu: kurejesha juu ya "kujaza"
"Kumbukumbu ya muda mrefu" nyingi ni kama:
-
upachikaji
-
duka la vekta
-
karatasi ya RAG ya urejeshaji iliyoongezwa kizazi (RAG)
Wakala hakariri. Hurejesha vipande muhimu zaidi wakati wa utekelezaji. LlamaIndex “Utangulizi wa RAG”
Sheria za kumbukumbu za vitendo
-
Hifadhi "mapendeleo" kama ukweli dhahiri: "Mtumiaji anapenda muhtasari wa taarifa na anachukia emoji" (lol, si hapa 😄)
-
"Maamuzi" ya duka yenye mihuri ya muda au matoleo (vinginevyo utata hurundikana)
-
Kamwe usihifadhi siri isipokuwa kama ni lazima
Na hii hapa sitiari yangu isiyokamilika: kumbukumbu ni kama jokofu. Usipoisafisha kamwe, hatimaye sandwichi yako ina ladha kama vitunguu na majuto.
9) Mifumo ya kupanga (kuanzia rahisi hadi dhana) 🧭✨
Kupanga ni mtengano unaodhibitiwa tu. Usiufanye kuwa wa fumbo.
Muundo A: Mpangaji wa orodha ya ukaguzi ✅
-
Mfano hutoa orodha ya hatua
-
Hutekeleza hatua kwa hatua
-
Hali ya orodha ya masasisho
Nzuri kwa ajili ya kujiunga. Rahisi, inaweza kujaribiwa.
Muundo B: Kitanzi cha Tenda Tena (sababu + kitendo) 🧠→🧰
-
modeli huamua simu inayofuata ya zana
-
huangalia matokeo
-
inarudia karatasi ya ReAct
Hii ndiyo hisia ya kawaida ya wakala.
Muundo C: Msimamizi-mfanyakazi 👥
-
msimamizi hugawanya lengo katika kazi
-
wafanyakazi hufanya kazi maalum
-
msimamizi huunganisha matokeo Microsoft AutoGen (mfumo wa mawakala wengi)
Hii ni muhimu wakati kazi zinaweza kulinganishwa, au unapotaka "majukumu" tofauti kama:
-
mtafiti
-
mkodishaji
-
mhariri
-
Kikagua QA
Mfano D: Panga kisha tekeleza kwa kupanga upya 🔄
-
tengeneza mpango
-
kutekeleza
-
Ikiwa matokeo ya zana yatabadilisha uhalisia, panga upya
Hii inamzuia mtendaji kufuata mpango mbaya kwa ukaidi. Wanadamu hufanya hivi pia, isipokuwa wamechoka, ambapo pia hufuata mipango mibaya.
10) Usalama, uaminifu, na kutofutwa kazi 🔐😅
Ikiwa wakala wako anaweza kuchukua hatua, unahitaji muundo wa usalama. Sio "nzuri kuwa nayo". Haja. NIST AI RMF 1.0
Mipaka migumu
-
hatua za juu kwa kila mbio
-
simu za juu zaidi za zana kwa dakika
-
matumizi ya juu kwa kila kipindi (bajeti ya tokeni)
-
zana zilizozuiliwa baada ya idhini
Ushughulikiaji wa data
-
rekebisha ingizo nyeti kabla ya kuingia kwenye kumbukumbu
-
mazingira tofauti (uendelezaji dhidi ya uzalishaji)
-
ruhusa za zana zenye upendeleo mdogo
Vikwazo vya kitabia
-
kumlazimisha wakala kutaja vipande vya ushahidi wa ndani (sio viungo vya nje, marejeleo ya ndani tu)
-
zinahitaji bendera za kutokuwa na uhakika wakati kujiamini ni kidogo
-
kuhitaji "uliza swali la ufafanuzi" ikiwa michango haina utata
Wakala anayeaminika si yule anayejiamini zaidi. Ni yule anayejua anapokisia… na kusema hivyo.
11) Upimaji na tathmini (sehemu ambayo kila mtu huepuka) 🧪📏
Huwezi kuboresha kile ambacho huwezi kupima. Ndiyo, mstari huo ni wa kijinga, lakini ni kweli kabisa.
Jenga seti ya hali
Unda kesi 30-100 za majaribio:
-
njia za furaha
-
kesi za ukingo
-
Kesi za "kushindwa kwa zana"
-
maombi yasiyoeleweka
-
Vidokezo vya upinzani (majaribio ya sindano ya haraka) OWASP 10 Bora kwa Programu za LLM OWASP LLM01 Uingizaji wa Prompt
Matokeo ya alama
Tumia vipimo kama vile:
-
kiwango cha mafanikio ya kazi
-
wakati wa kukamilisha
-
kiwango cha urejeshaji wa hitilafu ya zana
-
kiwango cha ndoto (madai bila ushahidi)
-
kiwango cha idhini ya binadamu (ikiwa iko katika hali ya usimamizi)
Vipimo vya urejeshaji kwa vidokezo na zana
Wakati wowote unapobadilisha:
-
mpango wa zana
-
maagizo ya mfumo
-
mantiki ya kurejesha
-
umbizo la kumbukumbu
Endesha seti tena.
Wakala ni wanyama nyeti. Kama mimea ya nyumbani, lakini ni ghali zaidi.
12) Mifumo ya upelekaji ambayo haiyeyushi bajeti yako 💸🔥
Anza na huduma moja
-
API ya kidhibiti cha wakala
-
huduma za zana nyuma yake
-
kumbukumbu + ufuatiliaji wa kitangulizi cha uchunguzi wa OpenTelemetry
Ongeza vidhibiti vya gharama mapema
-
matokeo ya urejeshaji wa akiba
-
kubana hali ya mazungumzo kwa kutumia muhtasari
-
kutumia mifumo midogo kwa ajili ya uelekezaji na uchimbaji
-
kupunguza "hali ya kufikiri kwa kina" kwa hatua ngumu zaidi
Chaguo la kawaida la usanifu
-
kidhibiti kisicho na serikali + duka la hali ya nje (DB/redis)
-
Simu za zana hazibadiliki inapowezekana Stripe "Maombi ya Kipekee"
-
foleni kwa kazi ndefu (ili usiruhusu ombi la wavuti kufunguliwa milele)
Pia: tengeneza "kifaa cha kuua". Hutakihitaji hadi utakapokihitaji kweli 😬
13) Maelezo ya Kufunga - toleo fupi kuhusu Jinsi ya Kujenga Wakala wa AI 🎁🤖
Kama hukumbuki kitu kingine chochote, kumbuka hili:
-
Jinsi ya Kujenga Wakala wa AI inahusu zaidi kujenga mzunguko salama kuzunguka modeli. Hati za "Wakala" za LangChain
-
Anza na lengo safi, uhuru mdogo, na zana kali. Matokeo ya Muundo wa OpenAI
-
Ongeza kumbukumbu kupitia urejeshaji, si kujaza muktadha bila kikomo. Karatasi ya RAG
-
Kupanga kunaweza kuwa rahisi - orodha za ukaguzi na kupanga upya huenda mbali.
-
Kurekodi na majaribio hubadilisha machafuko ya wakala kuwa kitu unachoweza kusafirisha. Kitangulizi cha uchunguzi wa OpenTelemetry
-
Vizuizi vya ulinzi vinafaa katika msimbo, si katika vidokezo tu. OWASP 10 Bora kwa Programu za LLM
Wakala si uchawi. Ni mfumo ambao hufanya maamuzi mazuri mara nyingi kiasi cha kuwa na thamani… na kukubali kushindwa kabla ya kusababisha uharibifu. Inafariji kimya kimya, kwa njia fulani 😌
Na ndio, ukijenga vizuri, inahisi kama kuajiri mwanafunzi mdogo wa kidijitali ambaye halali kamwe, wakati mwingine huwa na hofu, na anapenda makaratasi. Kwa hivyo, kimsingi ni mwanafunzi wa kidijitali.
Maswali Yanayoulizwa Mara kwa Mara
Kwa maneno rahisi, wakala wa akili bandia ni nini?
Wakala wa akili bandia (AI) kimsingi ni mzunguko unaorudia: kuchukua maoni, kuamua hatua inayofuata, kutumia zana, kusoma matokeo, na kurudia hadi yatakapokamilika. Sehemu ya "kiungo" inatokana na kutenda na kutazama, si kupiga gumzo tu. Wakala wengi ni otomatiki mahiri tu wenye ufikiaji wa zana, huku wengine wakitenda zaidi kama mwendeshaji mdogo ambaye anaweza kupona kutokana na hitilafu.
Ni lini ninapaswa kujenga wakala wa AI badala ya kutumia kidokezo tu?
Jenga wakala wakati kazi ni ya hatua nyingi, mabadiliko kulingana na matokeo ya kati, na inahitaji matumizi ya zana ya kuaminika (API, hifadhidata, tiketi, utekelezaji wa msimbo). Mawakala pia ni muhimu unapotaka matokeo yanayoweza kurudiwa kwa kutumia vizuizi na njia ya kuangalia "imekamilika." Ikiwa jibu rahisi la haraka linafanya kazi, wakala kwa kawaida huwa na gharama za ziada za uendeshaji na hali za kushindwa zaidi.
Ninawezaje kujenga wakala wa AI ambaye haingii kwenye vitanzi?
Tumia masharti ya kusimamisha kwa nguvu: hatua za juu zaidi, simu za juu zaidi za zana, na uondoe ukaguzi wa kukamilisha. Ongeza mipango ya zana iliyopangwa, muda wa kuisha, na majaribio mapya ambayo hayatajaribu tena milele. Andika maamuzi na matokeo ya zana ili uweze kuona mahali inapotoka. Vali ya kawaida ya usalama ni kuinuka: ikiwa wakala hana uhakika au anarudia makosa, anapaswa kuomba msaada badala ya kubuni.
Je, usanifu wa chini kabisa wa Jinsi ya Kujenga Wakala wa AI ni upi?
Kwa uchache unahitaji kitanzi cha kidhibiti kinacholisha modeli lengo na muktadha, kinachoomba kitendo kinachofuata, kinachotekeleza zana ikiombwa, kinachoongeza uchunguzi, na kinachorudiwa. Pia unahitaji zana zenye maumbo madhubuti ya ingizo/matokeo na ukaguzi "uliokamilika". Hata kitanzi cha kusongesha-mwenyewe kinaweza kufanya kazi vizuri ikiwa utaweka hali safi na kutekeleza mipaka ya hatua.
Ninapaswa kubuni vipi uundaji wa zana ili iweze kuaminika katika uzalishaji?
Weka zana nyembamba, zilizoandikwa, zilizoruhusiwa, na zilizothibitishwa—epuka zana ya jumla ya "fanya_chochote". Pendelea mipango madhubuti (kama matokeo yaliyopangwa/upigaji simu wa utendaji) ili wakala asiweze kusambaza ingizo kwa mkono. Ongeza orodha za vibali, mipaka ya viwango, na ukaguzi wa ruhusa ya mtumiaji/shirika kwenye safu ya zana. Buni zana ili ziwe salama kuzitumia tena inapowezekana, kwa kutumia mifumo ya idempotency.
Ni njia gani bora ya kuongeza kumbukumbu bila kumfanya mhudumu awe mbaya zaidi?
Chukulia kumbukumbu kama sehemu mbili: hali ya muda mfupi ya utekelezaji (hatua za hivi karibuni, mpango wa sasa, vikwazo) na urejeshaji wa muda mrefu (mapendeleo, sheria thabiti, hati husika). Weka muda mfupi katika muhtasari unaoendelea, si nakala kamili. Kwa kumbukumbu ya muda mrefu, urejeshaji (upachikaji + hifadhi ya vekta/ruwaza za RAG) kwa kawaida hushinda "kujaza" kila kitu katika muktadha na kuchanganya modeli.
Ni mpangilio gani wa kupanga nipaswa kutumia: orodha ya ukaguzi, ReAct, au msimamizi-mfanyakazi?
Mpangaji orodha ni mzuri wakati kazi zinatabirika na unataka kitu rahisi kujaribu. Mizunguko ya mtindo wa ReAct huangaza wakati matokeo ya zana yanabadilisha unachofanya baadaye. Mifumo ya msimamizi-mfanyakazi (kama vile utenganishaji wa majukumu wa mtindo wa AutoGen) husaidia wakati kazi zinaweza kulinganishwa au kufaidika na majukumu tofauti (mtafiti, msimbo, QA). Panga-kisha-tekeleza kwa kupanga upya ni msingi wa kati wa vitendo wa kuepuka mipango mibaya migumu.
Ninawezaje kumfanya wakala awe salama ikiwa anaweza kuchukua hatua halisi?
Tumia ruhusa zisizo na mapendeleo mengi na uzuie zana hatarishi nyuma ya idhini au hali za "kutofanya kazi kwa muda mrefu". Ongeza bajeti na kikomo: hatua za juu zaidi, matumizi ya juu zaidi, na mipaka ya simu ya zana kwa kila dakika. Rekebisha data nyeti kabla ya kurekodi, na utenganishe maendeleo na mazingira ya uzalishaji. Inahitaji alama za kutokuwa na uhakika au maswali ya kufafanua wakati michango ni tata, badala ya kuruhusu kujiamini kuchukua nafasi ya ushahidi.
Ninawezaje kujaribu na kutathmini wakala wa akili bandia ili aweze kuboreka baada ya muda?
Jenga seti ya matukio yenye njia za furaha, kesi za ukingo, kushindwa kwa zana, maombi yasiyoeleweka, na majaribio ya kuingiza haraka (mtindo wa OWASP). Pata matokeo kama vile mafanikio ya kazi, muda wa kukamilisha, kupona kutokana na makosa ya zana, na madai bila ushahidi. Wakati wowote unapobadilisha mipango ya zana, vidokezo, urejeshaji, au umbizo la kumbukumbu, endesha upya seti. Ikiwa huwezi kuijaribu, huwezi kuisafirisha kwa uhakika.
Ninawezaje kupeleka wakala bila kuzidisha ucheleweshaji na gharama?
Muundo wa kawaida ni kidhibiti kisicho na takwimu chenye hifadhi ya hali ya nje (DB/Redis), huduma za zana nyuma yake, na uandishi/ufuatiliaji imara (mara nyingi OpenTelemetry). Dhibiti gharama kwa kuhifadhi akiba ya urejeshaji, muhtasari wa hali ndogo, mifumo midogo ya uelekezaji/uchimbaji, na kupunguza "mawazo ya kina" kwa hatua ngumu zaidi. Tumia foleni kwa kazi ndefu ili usizuie maombi ya wavuti kufunguliwa. Jumuisha swichi ya kuua kila wakati.
Marejeleo
-
Taasisi ya Kitaifa ya Viwango na Teknolojia (NIST) - NIST AI RMF 1.0 (uaminifu na uwazi) - nvlpubs.nist.gov
-
OpenAI - Matokeo Yaliyopangwa - platform.openai.com
-
OpenAI - Mwongozo wa kupiga simu kwa njia ya utendaji kazi - platform.openai.com
-
OpenAI - Mwongozo wa mipaka ya viwango - platform.openai.com
-
OpenAI - Inaendesha API - platform.openai.com
-
OpenAI - Kitendakazi cha Msaidizi kinapiga simu - platform.openai.com
-
LangChain - Hati za Mawakala (JavaScript) - docs.langchain.com
-
LangChain - Hati za Vyombo (Python) - docs.langchain.com
-
LangChain - Muhtasari wa kumbukumbu - docs.langchain.com
-
arXiv - Karatasi ya ReAct (sababu + kitendo) - arxiv.org
-
arXiv - Karatasi ya RAG - arxiv.org
-
Maktaba ya Wajenzi ya Amazon Web Services (AWS) - Muda wa kuisha, majaribio mapya, na kurudi nyuma kwa kutumia jitter - aws.amazon.com
-
OpenTelemetry - Kitangulizi cha Uangalizi - opentelemetry.io
-
Stripe - Maombi ya Idempotent - docs.stripe.com
-
Google Cloud - Jaribu tena mkakati (nyuma + jitter) - docs.cloud.google.com
-
OWASP - 10 Bora kwa Matumizi ya Mfano wa Lugha Kubwa - owasp.org
-
Sindano ya Haraka ya OWASP - - genai.owasp.org
-
LlamaIndex - Utangulizi wa RAG - developers.llamaindex.ai
-
Microsoft - Kiini cha Semantiki - learn.microsoft.com
-
Microsoft AutoGen - Mfumo wa mawakala wengi (nyaraka) - microsoft.github.io
-
CrewAI - Dhana za Mawakala - docs.crevai.com
-
Nyasi ya majani (deepset) - Nyaraka za Retrievers - docs.haystack.deepset.ai