Ninawezaje kuhakikisha mafanikio ya mradi wangu wa wakala wa akili bandia (AI)?

Ili kuhakikisha mafanikio ya mradi wako wa wakala wa AI, fafanua wazi kazi hiyo katika sentensi moja na uamue kiwango cha uhuru unachokipenda. Zaidi ya hayo, tekeleza mipango madhubuti ya zana, kumbukumbu, na mikakati ya uthibitishaji ili kuzuia mitego ya kawaida na kuruhusu utatuzi bora wa matatizo.

Ninapaswa kuzingatia nini ninapobuni zana za wakala wangu wa AI?

Unapobuni zana za wakala wako wa AI, hakikisha zina umakini mdogo, zimechapwa, na zimeruhusiwa. Epuka zana za jumla zinazoweza kufanya kitendo chochote. Badala yake, tengeneza miito maalum ya utendaji ambayo wakala anaweza kutumia ili kudumisha usalama na uaminifu.

Ninawezaje kuweka masharti ya wazi ya kusimamisha kwa wakala wangu wa AI?

Ili kuweka masharti ya kusimama wazi kwa wakala wako wa AI, fafanua idadi ya juu ya hatua anazoweza kuchukua, pamoja na muda wa kuisha na ukaguzi wa kukamilisha. Hii itasaidia kuzuia wakala kukwama katika vitanzi na kuhakikisha anaweza kuongeza matatizo inapohitajika.

Ni ipi njia bora ya kudhibiti kumbukumbu katika wakala wa akili bandia (AI)?

Dhibiti kumbukumbu katika wakala wako wa AI kwa kuitenganisha katika vipengele vya muda mfupi na muda mrefu. Weka kumbukumbu ya muda mfupi ikiwa ndogo, ukizingatia hatua na mipango ya sasa, huku ukitumia kumbukumbu ya muda mrefu kwa taarifa thabiti kama vile mapendeleo ya mtumiaji na sheria za shirika.

Je, kuna mifumo maalum ya kupanga kazi ndani ya wakala wa AI?

Ndiyo, mifumo mbalimbali ya upangaji inaweza kutumika, kama vile orodha za ukaguzi za kazi zinazoweza kutabirika, mizunguko ya ReAct kwa majibu yanayoweza kubadilika kulingana na matokeo ya zana, na mifumo ya msimamizi-mfanyakazi inayowezesha utenganishaji wa majukumu kwa miradi tata. Chagua njia ya upangaji kulingana na mahitaji mahususi ya wakala wako.

Ninawezaje kutathmini kwa ufanisi utendaji wa wakala wangu wa AI?

Ili kutathmini utendaji wa wakala wako wa akili bandia, tengeneza seti ya matukio inayojumuisha njia za furaha, kesi za ukingo, na maombi yasiyoeleweka. Pata matokeo kulingana na vipimo kama vile kiwango cha mafanikio ya kazi, muda wa majibu, na urejeshaji kutoka kwa makosa ili kuboresha uwezo wake kila mara.

Jinsi ya Kujenga Wakala wa AI [Video na Maswali]

Jibu fupi: Ili kujenga wakala wa AI anayefanya kazi kwa vitendo, ichukulie kama mzunguko unaodhibitiwa: chukua ingizo, amua hatua inayofuata, piga simu kifaa chenye upeo mdogo, angalia matokeo, na urudie hadi ukaguzi ulio wazi wa "kukamilika" upite. Itapata uangalizi wake wakati kazi ina hatua nyingi na inaendeshwa na zana; ikiwa kidokezo kimoja kitaitatua, ruka wakala. Ongeza mipango madhubuti ya zana, mipaka ya hatua, kumbukumbu, na kithibitishaji/mkosoaji ili zana zitakaposhindwa au ingizo zikiwa na utata, wakala aongeze kasi badala ya kuzunguka.

Mambo muhimu ya kuzingatia:

Kitanzi cha kidhibiti: Tekeleza ingizo→tenda→angalia marudio kwa masharti dhahiri ya kusimamisha na hatua za juu zaidi.

Ubunifu wa zana: Weka zana nyembamba, zilizoandikwa, zilizoruhusiwa, na zilizothibitishwa ili kuzuia machafuko ya "kufanya_chochote".

Usafi wa kumbukumbu: Tumia hali ya muda mfupi pamoja na urejeshaji wa muda mrefu; epuka kutupa nakala kamili.

Upinzani wa matumizi mabaya: Ongeza orodha za ruhusa, mipaka ya viwango, kutokuwa na uwezo wa kufanya maamuzi, na "kutofanya maamuzi" kwa vitendo hatarishi.

Upimaji: Dumisha mpangilio wa matukio (kushindwa, utata, sindano) na urudie kila mabadiliko.

Jinsi ya Kujenga Wakala wa AI? Infographic

Makala ambazo unaweza kupenda kusoma baada ya hii:

🔗 Jinsi ya kupima utendaji wa AI
Jifunze vipimo vya vitendo ili kupima kasi, usahihi, na uaminifu.

🔗 Jinsi ya kuzungumza na AI
Tumia vidokezo, muktadha, na ufuatiliaji ili kupata majibu bora zaidi.

🔗 Jinsi ya kutathmini mifumo ya akili bandia (AI)
Linganisha mifumo kwa kutumia majaribio, rubriki, na matokeo ya kazi halisi.

🔗 Jinsi ya kuboresha mifumo ya akili bandia (AI)
Boresha ubora na gharama kwa kurekebisha, kupogoa, na kufuatilia.

1) Wakala wa akili bandia ni nini, kwa maneno ya kawaida 🧠

Wakala wa AI ni mzunguko. Hati za "Wakala" za LangChain

Ndivyo ilivyo. Kitanzi chenye ubongo katikati.

Ingizo → fikiria → tenda → tazama → rudia. Karatasi ya kutenda tena (sababu + tenda)

Wapi:

Ingizo ni ombi la mtumiaji au tukio (barua pepe mpya, tiketi ya usaidizi, ping ya kitambuzi).
Fikiria ni mfano wa lugha unaoelezea hatua inayofuata.
Act ni kuita kifaa (tafuta hati za ndani, endesha msimbo, unda tiketi, rasimu jibu). Mwongozo wa kupiga simu wa OpenAI Function
Observe inasoma matokeo ya zana.
Kurudia ndiyo sehemu inayoifanya ihisi kama "ya kimkakati" badala ya "ya kuzungumza". Hati za LangChain "Wakala"

Baadhi ya mawakala kimsingi ni makro mahiri. Wengine hufanya kazi zaidi kama opereta mdogo ambaye anaweza kusawazisha kazi na kupona kutokana na hitilafu. Zote zinahesabiwa.

Pia, huhitaji uhuru kamili. Kwa kweli ... labda hutaki 🙃

2) Wakati unapopaswa kujenga wakala (na wakati ambapo hupaswi) 🚦

Jenga wakala wakati:

Kazi ni ya hatua nyingi na hubadilika kulingana na kinachotokea katikati ya safari.
Kazi inahitaji matumizi ya zana (hifadhidata, CRM, utekelezaji wa msimbo, utengenezaji wa faili, vivinjari, API za ndani). Hati za "Zana" za LangChain
Unataka matokeo yanayoweza kurudiwa yenye vizuizi, si majibu ya mara moja tu.
Unaweza kufafanua "imekamilika" kwa njia ambayo kompyuta inaweza kuangalia, hata kwa njia isiyo na utaratibu.

Usijenge wakala wakati:

Jibu rahisi la haraka + jibu hutatua tatizo (usifanye mambo kupita kiasi, utajichukia baadaye).
Unahitaji uamuzi kamili (mawakala wanaweza kuwa thabiti, lakini si roboti).
Huna zana au data yoyote ya kuunganisha - basi kwa kiasi kikubwa ni hisia tu.

Tuwe wakweli: nusu ya "miradi ya wakala wa akili bandia" inaweza kuwa mtiririko wa kazi wenye sheria chache za matawi. Lakini, wakati mwingine hisia pia ni muhimu 🤷♂️

3) Ni nini kinachofanya toleo zuri la wakala wa akili bandia ✅

Hapa kuna sehemu ya "Ni nini kinachofanya toleo zuri la" uliyoomba, isipokuwa nitasema kwa uwazi kidogo:

Toleo zuri la wakala wa akili bandia (AI) si yule anayefikiria zaidi. Ni yule ambaye:

Anajua kinachoruhusiwa kufanya (mipaka ya wigo)
Hutumia zana kwa njia ya kuaminika (simu zilizopangwa, majaribio mapya, muda ulioisha) Mwongozo wa kupiga simu wa OpenAI Function AWS “Muda ulioisha, majaribio mapya, na kurudi nyuma kwa jitter”
Huweka hali safi (kumbukumbu ambayo haiozi) LangChain "Muhtasari wa kumbukumbu"
Inaelezea vitendo vyake (njia za ukaguzi, si hoja za siri) NIST AI RMF 1.0 (uaminifu na uwazi)
Husimama ipasavyo (ukaguzi kamili, hatua za juu zaidi, upandaji) Hati za "Wakala" za LangChain
Anashindwa salama (anaomba msaada, hadanganyi mamlaka) NIST AI RMF 1.0
Inaweza kujaribiwa (unaweza kuiendesha kwenye matukio ya makopo na kupata matokeo)

Ikiwa wakala wako hawezi kujaribiwa, kimsingi ni mashine ya yanayopangwa yenye ujasiri mkubwa. Inafurahisha kwenye sherehe, inatisha katika uzalishaji 😬

4) Vigezo vya msingi vya wakala ("anatomia" 🧩)

Wakala wengi imara wana vipande hivi:

A) Kitanzi cha kidhibiti 🔁

Huyu ndiye mratibu:

chukua lengo
muulize modeli kwa hatua inayofuata
zana ya kuendesha
ongeza uchunguzi
Rudia hadi hati za LangChain “Agents”

B) Zana (pia inajulikana kama uwezo) 🧰

Zana ndizo zinazomfanya wakala awe na ufanisi: Hati za LangChain “Zana”

maswali ya hifadhidata
kutuma barua pepe
kuvuta faili
msimbo unaoendeshwa
kupiga simu API za ndani
kuandika kwa lahajedwali au CRM

C) Kumbukumbu 🗃️

Aina mbili ni muhimu:

kumbukumbu ya muda mfupi: muktadha wa sasa wa utekelezaji, hatua za hivi karibuni, mpango wa sasa
kumbukumbu ya muda mrefu: mapendeleo ya mtumiaji, muktadha wa mradi, maarifa yaliyopatikana (mara nyingi kupitia upachikaji + duka la vekta) Karatasi ya RAG

D) Sera ya mipango na maamuzi 🧭

Hata kama huiita "kupanga", unahitaji mbinu:

orodha za ukaguzi
Karatasi ya ReAct ya mtindo wa ReAct "fikiria kisha chombo"
grafu za kazi
mifumo ya msimamizi-mfanyakazi
Mifumo ya msimamizi-mfanyakazi Microsoft AutoGen (mfumo wa mawakala wengi)

E) Vizuizi na tathmini 🧯

ruhusa
mipango ya zana salama Matokeo ya Muundo ya OpenAI
uthibitishaji wa matokeo
mipaka ya hatua
kumbukumbu
majaribio ya NIST AI RMF 1.0

Ndiyo, ni uhandisi zaidi kuliko kushawishi. Ambayo ni ... jambo la msingi.

5) Jedwali la Ulinganisho: njia maarufu za kujenga wakala 🧾

Hapa chini kuna "Jedwali la Ulinganisho" halisi - lenye mambo machache yasiyo ya kawaida, kwa sababu timu halisi ni za kipekee 😄

Zana / Mfumo	Hadhira	Bei	Kwa nini inafanya kazi	Maelezo (machafuko madogo)
LangChain	wajenzi wanaopenda vipengele vya mtindo wa lego	bure-ish + infra	mfumo mkuu wa vifaa, kumbukumbu, minyororo	inaweza kupata tambi haraka ikiwa hutaji mambo waziwazi
Kielezo cha Llama	Timu zenye RAG nyingi	bure-ish + infra	mifumo imara ya urejeshaji, uorodheshaji, viunganishi	vizuri wakati wakala wako kimsingi ni "utafutaji + kitendo" ... jambo ambalo ni la kawaida
Mbinu ya mtindo wa Wasaidizi wa OpenAI	timu zinazotaka usanidi wa haraka zaidi	kulingana na matumizi	Mifumo ya wito wa zana iliyojengewa ndani na hali ya uendeshaji	Haibadiliki sana katika baadhi ya pembe, lakini ni safi kwa programu nyingi	OpenAI Huendesha API ya Msaidizi wa OpenAI
Kernel ya Semantiki	watengenezaji wanaotaka mpangilio uliopangwa	huru-ish	muhtasari mzuri wa ujuzi/majukumu	Inahisi "nadhifu ya biashara" - wakati mwingine hiyo ni pongezi 😉
AutoGen	majaribio ya mawakala wengi	huru-ish	Mifumo ya ushirikiano wa wakala kwa wakala	anaweza kuongea kupita kiasi; kuweka sheria kali za kuachisha kazi
CrewAI	Mashabiki wa "timu za mawakala"	huru-ish	majukumu + kazi + makabidhiano ni rahisi kuelezea	hufanya kazi vizuri zaidi wakati kazi ni laini, si laini
Nyasi	tafuta + watu wa mabomba	huru-ish	mabomba imara, urejeshaji, vipengele	"ukumbi wa maonyesho wa mawakala" kidogo, "kiwanda cha vitendo" zaidi
Tembeza mwenyewe (kitanzi maalum)	watu wa kudhibiti (wenye upendo)	wakati wako	uchawi mdogo, uwazi wa hali ya juu	kwa kawaida huwa bora zaidi kwa muda mrefu… hadi utakapobuni upya kila kitu 😅

Hakuna mshindi mmoja. Chaguo bora linategemea kama kazi kuu ya wakala wako ni kutafuta, kutekeleza zana, uratibu wa mawakala wengi, au otomatiki ya mtiririko wa kazi.

6) Jinsi ya Kujenga Wakala wa AI hatua kwa hatua (mapishi halisi) 🍳🤖

Hii ndiyo sehemu ambayo watu wengi huipuuza, kisha wanajiuliza ni kwa nini wakala huyo ana tabia kama rakuni kwenye pantry.

Hatua ya 1: Fafanua kazi hiyo kwa sentensi moja 🎯

Mifano:

"Andika jibu la mteja kwa kutumia sera na muktadha wa tiketi, kisha omba idhini."
"Chunguza ripoti ya hitilafu, iandike tena, na upendekeze suluhisho."
"Badilisha maelezo yasiyokamilika ya mkutano kuwa kazi, wamiliki, na tarehe za mwisho."

Kama huwezi kuifafanua kwa urahisi, wakala wako naye hawezi. Namaanisha inaweza, lakini itabuniwa, na kubuniwa ndipo bajeti zinapokufa.

Hatua ya 2: Amua kiwango cha uhuru (cha chini, cha kati, chenye viungo) 🌶️

Uhuru mdogo: inapendekeza hatua, mibofyo ya kibinadamu "inakubali"
Kati: huendesha zana, hutoa rasimu, huongezeka kwa kutokuwa na uhakika
High: hutekeleza kuanzia mwanzo hadi mwisho, hupiga ping kwa wanadamu pekee kwa vighairi

Anza chini kuliko unavyotaka. Unaweza kuiongeza kasi baadaye.

Hatua ya 3: Chagua mkakati wako wa kielelezo 🧠

Kwa kawaida huchagua:

modeli moja imara kwa kila kitu (rahisi)
modeli moja imara + modeli ndogo kwa hatua za bei nafuu (uainishaji, uelekezaji)
mifumo maalum (maono, kanuni, usemi) ikiwa inahitajika

Pia amua:

tokeni za juu zaidi
halijoto
kama unaruhusu dalili ndefu za ndani (unaweza, lakini usifichue mnyororo mbichi wa mawazo kwa watumiaji wa mwisho)

Hatua ya 4: Fafanua zana kwa kutumia michoro kali 🔩

Zana zinapaswa kuwa:

nyembamba
iliyoandikwa
ruhusa
Matokeo ya Muundo wa OpenAI yaliyothibitishwa

Badala ya kifaa kinachoitwa do_anything(input: string), tengeneza:

tafuta_kb(swali: mfuatano) -> matokeo[]
tengeneza_tiketi(kichwa: mfuatano, mwili: mfuatano, kipaumbele: enum) -> kitambulisho_cha_tiketi
send_email(kwa: kamba, mada: kamba, mwili: kamba) -> hali Mwongozo wa kupiga simu wa OpenAI Function

Ukimpa wakala msumeno wa mnyororo, usishtuke anapokata ua kwa kuondoa uzio pia.

Hatua ya 5: Jenga kitanzi cha kidhibiti 🔁

Kitanzi cha chini kabisa:

Anza na lengo + muktadha wa awali
Muulize modeli: "Kitendo kinachofuata?"
Ikiwa simu ya zana - tekeleza zana
Ongeza uchunguzi
Angalia hali ya kusimama
Rudia (kwa hatua za juu zaidi) Hati za LangChain “Mawakala”

Ongeza:

muda wa kuisha
majaribio tena (kuwa mwangalifu - majaribio tena yanaweza kurudiwa) AWS “Muda unaisha, majaribio tena, na kurudi nyuma kwa jitter”
umbizo la hitilafu ya zana (wazi, iliyopangwa)

Hatua ya 6: Ongeza kumbukumbu kwa uangalifu 🗃️

Muda mfupi: weka "muhtasari wa hali" mdogo ukisasishwa kila hatua. LangChain "Muhtasari wa kumbukumbu"
Muda mrefu: hifadhi taarifa zinazodumu (mapendeleo ya mtumiaji, sheria za shirika, hati thabiti).

Kanuni ya kidole gumba:

ikiwa inabadilika mara kwa mara - iendelee kwa muda mfupi
ikiwa ni thabiti - duka la muda mrefu
ikiwa ni nyeti - hifadhi kwa kiasi kidogo (au isiwe hivyo kabisa)

Hatua ya 7: Ongeza uthibitisho na pasi ya "mkosoaji" 🧪

Muundo wa bei nafuu na wa vitendo:

wakala hutoa matokeo
kithibitishaji huangalia muundo na vikwazo
mapitio ya hiari ya mfumo wa wakosoaji kwa hatua zilizokosekana au ukiukaji wa sera NIST AI RMF 1.0

Sio kamili, lakini inashangaza sana.

Hatua ya 8: Andika kila kitu ambacho utajuta kutokuandika 📜

Kumbukumbu:

simu za zana + ingizo + matokeo
maamuzi yaliyofanywa
makosa
matokeo ya mwisho
tokeni na ucheleweshaji wa utangulizi wa OpenTelemetry

Wakati ujao - utakushukuru. Sasa - utasahau. Hayo ni maisha tu 😵💫

7) Kupiga simu kwa zana ambazo hazikuvunji roho 🧰😵

Utumiaji wa zana ndio mahali ambapo "Jinsi ya Kujenga Wakala wa AI" inakuwa uhandisi halisi wa programu.

Fanya zana ziwe za kutegemewa (kutegemewa ni nzuri)

Zana zinazotegemewa ni:

yenye uamuzi
wigo mwembamba
rahisi kujaribu
salama kuendesha tena Stripe "Maombi ya Idempotent"

Ongeza vizuizi kwenye safu ya zana, si vidokezo tu

Vidokezo ni mapendekezo ya heshima. Uthibitisho wa zana ni mlango uliofungwa. Matokeo ya Muundo wa OpenAI

Fanya:

orodha za vibali (zana ambazo zinaweza kutumika)
uthibitisho wa ingizo
mipaka ya viwango OpenAI Mwongozo wa mipaka ya viwango
ukaguzi wa ruhusa kwa kila mtumiaji/shirika
"Hali ya kukimbia bila kutumia nguvu" kwa vitendo hatarishi

Ubunifu wa hitilafu ya sehemu

Zana zinashindwa kufanya kazi. Mitandao inayumbayumba. Uidhinishaji unaisha muda wake. Wakala lazima:

kutafsiri makosa
Jaribu tena kwa kurudi nyuma inapohitajika mkakati wa kujaribu tena wa Google Cloud (kurudi nyuma + jitter)
chagua zana mbadala
kuongezeka wakati wa kukwama

Ujanja mzuri kimya kimya: rudisha makosa yaliyopangwa kama:

aina: auth_error
aina: haipatikani
aina: kiwango_kidogo
Kwa hivyo modeli inaweza kujibu kwa busara badala ya kuogopa.

8) Kumbukumbu inayokusaidia badala ya kukusumbua 👻🗂️

Kumbukumbu ina nguvu, lakini pia inaweza kuwa kikwazo cha takataka.

Kumbukumbu ya muda mfupi: iweke ndogo

Tumia:

hatua za mwisho N
muhtasari unaoendelea (imesasishwa kila kitanzi)
mpango wa sasa
vikwazo vya sasa (bajeti, muda, sera)

Ukiweka kila kitu katika muktadha, unapata:

gharama kubwa zaidi
ucheleweshaji wa polepole
mkanganyiko zaidi (ndio, hata hivyo)

Kumbukumbu ya muda mrefu: kurejesha juu ya "kujaza"

"Kumbukumbu ya muda mrefu" nyingi ni kama:

upachikaji
duka la vekta
karatasi ya RAG ya urejeshaji iliyoongezwa kizazi (RAG)

Wakala hakariri. Hurejesha vipande muhimu zaidi wakati wa utekelezaji. LlamaIndex “Utangulizi wa RAG”

Sheria za kumbukumbu za vitendo

Hifadhi "mapendeleo" kama ukweli dhahiri: "Mtumiaji anapenda muhtasari wa taarifa na anachukia emoji" (lol, si hapa 😄)
"Maamuzi" ya duka yenye mihuri ya muda au matoleo (vinginevyo utata hurundikana)
Kamwe usihifadhi siri isipokuwa kama ni lazima

Na hii hapa sitiari yangu isiyokamilika: kumbukumbu ni kama jokofu. Usipoisafisha kamwe, hatimaye sandwichi yako ina ladha kama vitunguu na majuto.

9) Mifumo ya kupanga (kuanzia rahisi hadi dhana) 🧭✨

Kupanga ni mtengano unaodhibitiwa tu. Usiufanye kuwa wa fumbo.

Muundo A: Mpangaji wa orodha ya ukaguzi ✅

Mfano hutoa orodha ya hatua
Hutekeleza hatua kwa hatua
Hali ya orodha ya masasisho

Nzuri kwa ajili ya kujiunga. Rahisi, inaweza kujaribiwa.

Muundo B: Kitanzi cha Tenda Tena (sababu + kitendo) 🧠→🧰

modeli huamua simu inayofuata ya zana
huangalia matokeo
inarudia karatasi ya ReAct

Hii ndiyo hisia ya kawaida ya wakala.

Muundo C: Msimamizi-mfanyakazi 👥

msimamizi hugawanya lengo katika kazi
wafanyakazi hufanya kazi maalum
msimamizi huunganisha matokeo Microsoft AutoGen (mfumo wa mawakala wengi)

Hii ni muhimu wakati kazi zinaweza kulinganishwa, au unapotaka "majukumu" tofauti kama:

mtafiti
mkodishaji
mhariri
Kikagua QA

Mfano D: Panga kisha tekeleza kwa kupanga upya 🔄

tengeneza mpango
kutekeleza
Ikiwa matokeo ya zana yatabadilisha uhalisia, panga upya

Hii inamzuia mtendaji kufuata mpango mbaya kwa ukaidi. Wanadamu hufanya hivi pia, isipokuwa wamechoka, ambapo pia hufuata mipango mibaya.

10) Usalama, uaminifu, na kutofutwa kazi 🔐😅

Ikiwa wakala wako anaweza kuchukua hatua, unahitaji muundo wa usalama. Sio "nzuri kuwa nayo". Haja. NIST AI RMF 1.0

Mipaka migumu

hatua za juu kwa kila mbio
simu za juu zaidi za zana kwa dakika
matumizi ya juu kwa kila kipindi (bajeti ya tokeni)
zana zilizozuiliwa baada ya idhini

Ushughulikiaji wa data

rekebisha ingizo nyeti kabla ya kuingia kwenye kumbukumbu
mazingira tofauti (uendelezaji dhidi ya uzalishaji)
ruhusa za zana zenye upendeleo mdogo

Vikwazo vya kitabia

kumlazimisha wakala kutaja vipande vya ushahidi wa ndani (sio viungo vya nje, marejeleo ya ndani tu)
zinahitaji bendera za kutokuwa na uhakika wakati kujiamini ni kidogo
kuhitaji "uliza swali la ufafanuzi" ikiwa michango haina utata

Wakala anayeaminika si yule anayejiamini zaidi. Ni yule anayejua anapokisia… na kusema hivyo.

11) Upimaji na tathmini (sehemu ambayo kila mtu huepuka) 🧪📏

Huwezi kuboresha kile ambacho huwezi kupima. Ndiyo, mstari huo ni wa kijinga, lakini ni kweli kabisa.

Jenga seti ya hali

Unda kesi 30-100 za majaribio:

njia za furaha
kesi za ukingo
Kesi za "kushindwa kwa zana"
maombi yasiyoeleweka
Vidokezo vya upinzani (majaribio ya sindano ya haraka) OWASP 10 Bora kwa Programu za LLM OWASP LLM01 Uingizaji wa Prompt

Matokeo ya alama

Tumia vipimo kama vile:

kiwango cha mafanikio ya kazi
wakati wa kukamilisha
kiwango cha urejeshaji wa hitilafu ya zana
kiwango cha ndoto (madai bila ushahidi)
kiwango cha idhini ya binadamu (ikiwa iko katika hali ya usimamizi)

Vipimo vya urejeshaji kwa vidokezo na zana

Wakati wowote unapobadilisha:

mpango wa zana
maagizo ya mfumo
mantiki ya kurejesha
umbizo la kumbukumbu
Endesha seti tena.

Wakala ni wanyama nyeti. Kama mimea ya nyumbani, lakini ni ghali zaidi.

12) Mifumo ya upelekaji ambayo haiyeyushi bajeti yako 💸🔥

Anza na huduma moja

API ya kidhibiti cha wakala
huduma za zana nyuma yake
kumbukumbu + ufuatiliaji wa kitangulizi cha uchunguzi wa OpenTelemetry

Ongeza vidhibiti vya gharama mapema

matokeo ya urejeshaji wa akiba
kubana hali ya mazungumzo kwa kutumia muhtasari
kutumia mifumo midogo kwa ajili ya uelekezaji na uchimbaji
kupunguza "hali ya kufikiri kwa kina" kwa hatua ngumu zaidi

Chaguo la kawaida la usanifu

kidhibiti kisicho na serikali + duka la hali ya nje (DB/redis)
Simu za zana hazibadiliki inapowezekana Stripe "Maombi ya Kipekee"
foleni kwa kazi ndefu (ili usiruhusu ombi la wavuti kufunguliwa milele)

Pia: tengeneza "kifaa cha kuua". Hutakihitaji hadi utakapokihitaji kweli 😬

13) Maelezo ya Kufunga - toleo fupi kuhusu Jinsi ya Kujenga Wakala wa AI 🎁🤖

Kama hukumbuki kitu kingine chochote, kumbuka hili:

Jinsi ya Kujenga Wakala wa AI inahusu zaidi kujenga mzunguko salama kuzunguka modeli. Hati za "Wakala" za LangChain
Anza na lengo safi, uhuru mdogo, na zana kali. Matokeo ya Muundo wa OpenAI
Ongeza kumbukumbu kupitia urejeshaji, si kujaza muktadha bila kikomo. Karatasi ya RAG
Kupanga kunaweza kuwa rahisi - orodha za ukaguzi na kupanga upya huenda mbali.
Kurekodi na majaribio hubadilisha machafuko ya wakala kuwa kitu unachoweza kusafirisha. Kitangulizi cha uchunguzi wa OpenTelemetry
Vizuizi vya ulinzi vinafaa katika msimbo, si katika vidokezo tu. OWASP 10 Bora kwa Programu za LLM

Wakala si uchawi. Ni mfumo ambao hufanya maamuzi mazuri mara nyingi kiasi cha kuwa na thamani… na kukubali kushindwa kabla ya kusababisha uharibifu. Inafariji kimya kimya, kwa njia fulani 😌

Na ndio, ukijenga vizuri, inahisi kama kuajiri mwanafunzi mdogo wa kidijitali ambaye halali kamwe, wakati mwingine huwa na hofu, na anapenda makaratasi. Kwa hivyo, kimsingi ni mwanafunzi wa kidijitali.

Mfano halisi: Kujenga wakala wa usaidizi wa uundaji wa akili bandia (AI) 🎫🤖

Hali

Hebu fikiria timu ndogo ya SaaS ikipokea tiketi za usaidizi 120-180 kwa wiki. Tikiti nyingi si ngumu, lakini bado huchukua muda: kuweka upya nenosiri, maswali ya bili, ripoti za hitilafu, maombi ya vipengele, na ujumbe wa "je, hii ni tabia inayotarajiwa?".

Boti rahisi ya gumzo inaweza kuandika majibu, lakini haiwezi kuangalia hali ya akaunti kwa uhakika, kutafuta msingi wa maarifa, kuainisha uharaka, au kuamua ni lini mwanadamu anahitaji kuingilia kati. Hapa ndipo wakala anapoelewa.

Lengo si kuchukua nafasi kamili ya usaidizi. Lengo ni kujenga wakala asiye na uhuru wa kutosha ambaye husoma tiketi mpya, hukusanya muktadha, huandika jibu, na kuelekeza tiketi kwenye foleni sahihi. Binadamu bado anakubali chochote kinachomkabili mteja.

Kile ambacho msaidizi anahitaji

Ili kufanya kazi kwa usalama, wakala anahitaji seti ndogo ya pembejeo na zana zinazodhibitiwa:

Ujumbe wa tiketi inayoingia
Aina ya mpango wa mteja, umri wa akaunti, na hali ya malipo ya hivi karibuni
Kumbukumbu ya mabadiliko ya bidhaa ya hivi karibuni au matukio yanayojulikana
Makala ya kituo cha usaidizi cha ndani
Zana ya kusasisha tiketi yenye sehemu chache
Zana ya kujibu rasimu, si zana ya kutuma barua pepe
Sera iliyo wazi ya kuongeza kasi

Orodha ya zana inapaswa kubaki nyembamba kwa makusudi:

kituo_cha_msaada_cha_tafuta(hoji)
pata_hali_ya_mteja(kitambulisho_cha_mteja)
angalia_matukio_yanayojulikana(eneo_la_bidhaa)
kategoria_ya_tiketi_mpya(kitambulisho_cha_tiketi, kategoria, kipaumbele)
jibu_la_rasimu(kitambulisho_cha_tikiti, maandishi_ya_jibu)
escalation_to_binadamu(tiketi_kitambulisho, sababu)

Angalia kinachokosekana: hakuna zana ya "mteja anayerejeshewa pesa", "funga akaunti", au "tuma jibu la mwisho". Vitendo hivyo ni hatari sana kwa toleo la kwanza.

Mfano wa maelekezo

Wewe ni wakala wa usaidizi wa triage kwa bidhaa ya SaaS.

Kazi yako ni kuainisha tiketi zinazoingia, kukusanya muktadha unaohitajika tu, kuandika jibu lililopendekezwa, na kuamua kama tiketi inapaswa kuongezwa.

Sheria:

Usitume majibu moja kwa moja kwa wateja.

Tumia kituo cha usaidizi kabla ya kujibu maswali ya bidhaa.

Angalia hali ya mteja kabla ya kujibu maswali ya bili, mpango, au ufikiaji.

Ikiwa mteja atataja vitisho vya kisheria, upotevu wa data, masuala ya usalama, kushindwa kwa malipo, kughairi akaunti, au lugha ya hasira, hubadilika na kuwa mtu.

Ikiwa jibu haliungwi mkono na maudhui ya kituo cha usaidizi au data ya akaunti iliyopatikana, sema kinachokosekana na uongeze kasi.

Acha baada ya simu 6 za zana kufikia kiwango cha juu zaidi.

Tikiti "imekamilika" tu wakati ina kategoria, kipaumbele, muhtasari wa ushahidi, jibu la rasimu, na ama "idhini ya kibinadamu inahitajika" au "imeongezeka".

Jinsi ya kuijaribu

Anza na tiketi 30 za majaribio kabla ya kuziunganisha na watumiaji wa moja kwa moja:

Tikiti 10 za kawaida, kama vile kuweka upya nenosiri, mipaka ya mpango, na maswali ya msingi ya "nifanyeje?"
Tikiti 5 za malipo
Ripoti 5 za hitilafu
Tikiti 5 zisizoeleweka zenye taarifa zinazokosekana
Tikiti 5 hatarishi, kama vile wasiwasi wa usalama, madai ya kurejeshewa pesa, na malalamiko ya hasira

Kwa kila tiketi, andika:

Je, ilichagua kategoria sahihi?
Je, ilitumia kifaa sahihi kabla ya kujibu?
Je, iliepuka madai yasiyoungwa mkono?
Je, iliongeza tikiti hatari?
Je, rasimu ilihitaji uhariri mzito?

Lahajedwali rahisi ya kupitisha/kushindwa inatosha mwanzoni. Usiongeze mfumo wa tathmini kupita kiasi kabla ya kujua kama wakala anatoa thamani.

Matokeo

Matokeo ya kielelezo: Kulingana na muda wa tiketi 30 za sampuli kabla na baada ya kutumia mtiririko huu wa kazi, mwongozo wa usaidizi unaweza kupima yafuatayo:

Wastani wa muda wa majaribio ya kwanza umepunguzwa kutoka dakika 6 kwa kila tiketi hadi sekunde 90
Tikiti 30 zilipangwa kwa dakika 45 badala ya saa 3
Tikiti 27 kati ya 30 zimewekwa katika kategoria sahihi
Tikiti 5 kati ya 5 hatari ziliongezwa kwa usahihi
Majibu ya wateja 0 hayakutumwa bila idhini ya kibinadamu

Nambari hizi ni mfano wa makadirio, si kipimo kilichothibitishwa. Kipimo ni rahisi kurudia: panga muda wa kundi lile lile la tiketi za majaribio kwa mikono, kisha uzipitishe kupitia wakala na ulinganishe usahihi wa kategoria, usahihi wa upandaji, na muda wa kuhariri.

Ni nini kinachoweza kwenda vibaya

Wakala bado anaweza kushindwa kwa njia za kawaida sana.

Inaweza kuainishwa kama mteja aliyekasirika lakini rahisi "wa dharura" kwa sababu lugha inasikika kuwa na hasira. Inaweza kuandika jibu la uhakika kutoka kwa makala ya usaidizi iliyopitwa na wakati. Inaweza kuendelea kutafuta wakati hatua sahihi ni kuiongeza kasi. Inaweza kufichua maelezo mengi ya akaunti katika rasimu ya majibu.

Suluhisho si "kuandika pendekezo bora" na matumaini. Ongeza mipaka migumu:

Ongezeko la bei linapoonekana wakati lugha ya bili, usalama, kisheria, au kughairi
Inahitaji marejeleo kutoka kwa makala za usaidizi wa ndani katika muhtasari wa ushahidi
Weka "tuma jibu" nyuma ya idhini ya kibinadamu
Ingia kila simu ya zana na rasimu ya mwisho
Rudia tena seti ya majaribio ya tikiti 30 baada ya kila ombi, zana, au mabadiliko ya sera

Kuchukua kwa vitendo

Wakala muhimu hahitaji uhuru wa kuigiza. Katika mfano huu, thamani hutoka kwenye mzunguko unaodhibitiwa: soma tiketi, tafuta muktadha sahihi, uiainisha, andika jibu, na usimame kwa ajili ya ukaguzi. Hilo ni rahisi zaidi kuamini, kujaribu, na kuboresha kuliko wakala anayejaribu "kushughulikia usaidizi" kwa kidokezo kimoja kikubwa.

Maswali Yanayoulizwa Mara kwa Mara

Kwa maneno rahisi, wakala wa akili bandia ni nini?

Wakala wa akili bandia (AI) kimsingi ni mzunguko unaorudia: kuchukua maoni, kuamua hatua inayofuata, kutumia zana, kusoma matokeo, na kurudia hadi yatakapokamilika. Sehemu ya "kiungo" inatokana na kutenda na kutazama, si kupiga gumzo tu. Wakala wengi ni otomatiki mahiri tu wenye ufikiaji wa zana, huku wengine wakitenda zaidi kama mwendeshaji mdogo ambaye anaweza kupona kutokana na hitilafu.

Ni lini ninapaswa kujenga wakala wa AI badala ya kutumia kidokezo tu?

Jenga wakala wakati kazi ni ya hatua nyingi, mabadiliko kulingana na matokeo ya kati, na inahitaji matumizi ya zana ya kuaminika (API, hifadhidata, tiketi, utekelezaji wa msimbo). Mawakala pia ni muhimu unapotaka matokeo yanayoweza kurudiwa kwa kutumia vizuizi na njia ya kuangalia "imekamilika." Ikiwa jibu rahisi la haraka linafanya kazi, wakala kwa kawaida huwa na gharama za ziada za uendeshaji na hali za kushindwa zaidi.

Ninawezaje kujenga wakala wa AI ambaye haingii kwenye vitanzi?

Tumia masharti ya kusimamisha kwa nguvu: hatua za juu zaidi, simu za juu zaidi za zana, na uondoe ukaguzi wa kukamilisha. Ongeza mipango ya zana iliyopangwa, muda wa kuisha, na majaribio mapya ambayo hayatajaribu tena milele. Andika maamuzi na matokeo ya zana ili uweze kuona mahali inapotoka. Vali ya kawaida ya usalama ni kuinuka: ikiwa wakala hana uhakika au anarudia makosa, anapaswa kuomba msaada badala ya kubuni.

Je, usanifu wa chini kabisa wa Jinsi ya Kujenga Wakala wa AI ni upi?

Kwa uchache unahitaji kitanzi cha kidhibiti kinacholisha modeli lengo na muktadha, kinachoomba kitendo kinachofuata, kinachotekeleza zana ikiombwa, kinachoongeza uchunguzi, na kinachorudiwa. Pia unahitaji zana zenye maumbo madhubuti ya ingizo/matokeo na ukaguzi "uliokamilika". Hata kitanzi cha kusongesha-mwenyewe kinaweza kufanya kazi vizuri ikiwa utaweka hali safi na kutekeleza mipaka ya hatua.

Ninapaswa kubuni vipi uundaji wa zana ili iweze kuaminika katika uzalishaji?

Weka zana nyembamba, zilizoandikwa, zilizoruhusiwa, na zilizothibitishwa—epuka zana ya jumla ya "fanya_chochote". Pendelea mipango madhubuti (kama matokeo yaliyopangwa/upigaji simu wa utendaji) ili wakala asiweze kusambaza ingizo kwa mkono. Ongeza orodha za vibali, mipaka ya viwango, na ukaguzi wa ruhusa ya mtumiaji/shirika kwenye safu ya zana. Buni zana ili ziwe salama kuzitumia tena inapowezekana, kwa kutumia mifumo ya idempotency.

Ni njia gani bora ya kuongeza kumbukumbu bila kumfanya mhudumu awe mbaya zaidi?

Chukulia kumbukumbu kama sehemu mbili: hali ya muda mfupi ya utekelezaji (hatua za hivi karibuni, mpango wa sasa, vikwazo) na urejeshaji wa muda mrefu (mapendeleo, sheria thabiti, hati husika). Weka muda mfupi katika muhtasari unaoendelea, si nakala kamili. Kwa kumbukumbu ya muda mrefu, urejeshaji (upachikaji + hifadhi ya vekta/ruwaza za RAG) kwa kawaida hushinda "kujaza" kila kitu katika muktadha na kuchanganya modeli.

Ni mpangilio gani wa kupanga nipaswa kutumia: orodha ya ukaguzi, ReAct, au msimamizi-mfanyakazi?

Mpangaji orodha ni mzuri wakati kazi zinatabirika na unataka kitu rahisi kujaribu. Mizunguko ya mtindo wa ReAct huangaza wakati matokeo ya zana yanabadilisha unachofanya baadaye. Mifumo ya msimamizi-mfanyakazi (kama vile utenganishaji wa majukumu wa mtindo wa AutoGen) husaidia wakati kazi zinaweza kulinganishwa au kufaidika na majukumu tofauti (mtafiti, msimbo, QA). Panga-kisha-tekeleza kwa kupanga upya ni msingi wa kati wa vitendo wa kuepuka mipango mibaya migumu.

Ninawezaje kumfanya wakala awe salama ikiwa anaweza kuchukua hatua halisi?

Tumia ruhusa zisizo na mapendeleo mengi na uzuie zana hatarishi nyuma ya idhini au hali za "kutofanya kazi kwa muda mrefu". Ongeza bajeti na kikomo: hatua za juu zaidi, matumizi ya juu zaidi, na mipaka ya simu ya zana kwa kila dakika. Rekebisha data nyeti kabla ya kurekodi, na utenganishe maendeleo na mazingira ya uzalishaji. Inahitaji alama za kutokuwa na uhakika au maswali ya kufafanua wakati michango ni tata, badala ya kuruhusu kujiamini kuchukua nafasi ya ushahidi.

Ninawezaje kujaribu na kutathmini wakala wa akili bandia ili aweze kuboreka baada ya muda?

Jenga seti ya matukio yenye njia za furaha, kesi za ukingo, kushindwa kwa zana, maombi yasiyoeleweka, na majaribio ya kuingiza haraka (mtindo wa OWASP). Pata matokeo kama vile mafanikio ya kazi, muda wa kukamilisha, kupona kutokana na makosa ya zana, na madai bila ushahidi. Wakati wowote unapobadilisha mipango ya zana, vidokezo, urejeshaji, au umbizo la kumbukumbu, endesha upya seti. Ikiwa huwezi kuijaribu, huwezi kuisafirisha kwa uhakika.

Ninawezaje kupeleka wakala bila kuzidisha ucheleweshaji na gharama?

Muundo wa kawaida ni kidhibiti kisicho na takwimu chenye hifadhi ya hali ya nje (DB/Redis), huduma za zana nyuma yake, na uandishi/ufuatiliaji imara (mara nyingi OpenTelemetry). Dhibiti gharama kwa kuhifadhi akiba ya urejeshaji, muhtasari wa hali ndogo, mifumo midogo ya uelekezaji/uchimbaji, na kupunguza "mawazo ya kina" kwa hatua ngumu zaidi. Tumia foleni kwa kazi ndefu ili usizuie maombi ya wavuti kufunguliwa. Jumuisha swichi ya kuua kila wakati.

Marejeleo

Taasisi ya Kitaifa ya Viwango na Teknolojia (NIST) - NIST AI RMF 1.0 (uaminifu na uwazi) - nvlpubs.nist.gov
OpenAI - Matokeo Yaliyopangwa - platform.openai.com
OpenAI - Mwongozo wa kupiga simu kwa njia ya utendaji kazi - platform.openai.com
OpenAI - Mwongozo wa mipaka ya viwango - platform.openai.com
OpenAI - Inaendesha API - platform.openai.com
OpenAI - Kitendakazi cha Msaidizi kinapiga simu - platform.openai.com
LangChain - Hati za Mawakala (JavaScript) - docs.langchain.com
LangChain - Hati za Vyombo (Python) - docs.langchain.com
LangChain - Muhtasari wa kumbukumbu - docs.langchain.com
arXiv - Karatasi ya ReAct (sababu + kitendo) - arxiv.org
arXiv - Karatasi ya RAG - arxiv.org
Maktaba ya Wajenzi ya Amazon Web Services (AWS) - Muda wa kuisha, majaribio mapya, na kurudi nyuma kwa kutumia jitter - aws.amazon.com
OpenTelemetry - Kitangulizi cha Uangalizi - opentelemetry.io
Stripe - Maombi ya Idempotent - docs.stripe.com
Google Cloud - Jaribu tena mkakati (nyuma + jitter) - docs.cloud.google.com
OWASP - 10 Bora kwa Matumizi ya Mfano wa Lugha Kubwa - owasp.org
Sindano ya Haraka ya OWASP - LLM01 - genai.owasp.org
LlamaIndex - Utangulizi wa RAG - developers.llamaindex.ai
Microsoft - Kiini cha Semantiki - learn.microsoft.com
Microsoft AutoGen - Mfumo wa mawakala wengi (nyaraka) - microsoft.github.io
CrewAI - Dhana za Mawakala - docs.crevai.com
Nyasi ya majani (deepset) - Nyaraka za Retrievers - docs.haystack.deepset.ai

Pata Akili ya Kielektroniki ya Hivi Punde katika Duka Rasmi la Msaidizi wa Akili ya Kielektroniki

Kuhusu Sisi

Rudi kwenye blogu