Je, uongezaji wa ukubwa wa akili bandia (AI) unatofautianaje na mbinu za jadi za kubadilisha ukubwa?

Upanuzi wa akili bandia (AI) hutabiri maelezo yasiyo na ubora wa juu kutoka kwa mifumo iliyopo kwenye picha, badala ya kunyoosha pikseli tu kama mbinu za kitamaduni kama vile uandishi wa bicubic. Hii husababisha picha kali na zenye maelezo zaidi.

Ni mabaki gani ya kawaida ambayo ninapaswa kuangalia ninapotumia upandishaji wa upangaji wa akili bandia (AI)?

Vitu vya kawaida ni pamoja na halo zinazozunguka kingo, mifumo ya umbile inayojirudia, nyuso laini sana au zenye nta, na maandishi yanayobadilika kuwa 'karibu herufi.' Ni muhimu kufuatilia masuala haya ili kuhakikisha matokeo yanaonekana ya asili.

Kwa nini nyuso wakati mwingine huonekana laini sana au zisizo za kweli baada ya kupandishwa?

Nyuso zinaweza kuonekana laini kupita kiasi kutokana na kuondoa kelele na kunoa kwa nguvu ambayo inaweza kuondoa umbile kama vile vinyweleo. Ili kupata mwonekano wa asili zaidi, fikiria kupunguza mipangilio ya kuondoa kelele na kunoa.

Nifanye nini ikiwa picha zangu zinaonekana kuwa ngumu au zina kelele nyingi baada ya kutumia upandishaji wa juu wa akili bandia (AI)?

Ikiwa picha zako zinaonekana kuwa ngumu, jaribu kurekebisha vitelezi vya denoise na uboreshaji wa maelezo. Kuongeza chembe ndogo kunaweza pia kusaidia kurejesha hisia ya kupiga picha zaidi.

Je, mifano ya GAN na CNN inalinganishwaje katika matokeo ya kuongeza ukubwa wa akili bandia (AI)?

Mifumo ya CNN kwa ujumla ni thabiti na inayoweza kutabirika, huku mifumo ya GAN mara nyingi ikitoa maelezo makali lakini ina hatari ya kuanzisha vipengele visivyo vya kweli. Kuchagua kati yao kunategemea hitaji lako la uhalisia dhidi ya umbile lililoboreshwa.

Je, upandishaji wa akili bandia (AI) unafaa kwa maudhui ya video, na unaleta changamoto gani?

Ndiyo, upandishaji wa ukubwa wa akili bandia unafaa kwa video lakini unaweza kuwa changamoto kwa sababu uthabiti katika fremu ni muhimu. Maelezo yanayong'aa au yanayong'aa yanaweza kuvuruga watazamaji, kwa hivyo mbinu maalum zinazolenga video zinapendekezwa.

Ni lini haifai kutegemea uongezaji wa akili bandia (AI)?

Kuongeza wigo wa akili bandia (AI) kunapaswa kutumika kwa uangalifu katika hali zenye hatari kubwa, kama vile uandishi wa habari au uchambuzi wa kisayansi, ambapo usahihi ni muhimu. Ni bora kuzingatiwa kama uboreshaji badala ya uthibitisho kamili, na uwazi kuhusu michakato ya akili bandia ni muhimu.

Ni mambo gani ninayopaswa kuzingatia ninapoongeza ukubwa wa picha zilizobanwa sana?

Kwa picha zilizobanwa sana, anza na kuondoa vipengee vya bandia ili kupunguza kizuizi chochote kisichohitajika. Baada ya hapo, unaweza kuongeza na kunoa mwangaza ikiwa ni lazima ili kudumisha maelezo bila kuongeza vipengee vya kubanwa.

Upscaling ya AI inafanyaje kazi? [Video na Maswali]

Jibu fupi: Upandishaji wa AI hufanya kazi kwa kufunza modeli kwenye picha zenye ubora wa chini na wa juu zilizounganishwa, kisha kuitumia kutabiri pikseli za ziada zinazoaminika wakati wa upandishaji wa modeli. Ikiwa modeli imeona umbile au nyuso zinazofanana katika mafunzo, inaweza kuongeza maelezo ya kushawishi; la sivyo, inaweza "kudanganya" vitu vya kale kama vile halos, ngozi kama nta, au kung'aa kwenye video.

Mambo muhimu ya kuzingatia:

Utabiri: Mfano huu hutoa maelezo yanayowezekana, si ujenzi mpya wa uhalisia uliohakikishwa.

Chaguo la mfumo: CNN huwa na utulivu zaidi; GAN zinaweza kuonekana kuwa kali zaidi lakini zikihatarisha uvumbuzi wa vipengele.

Ukaguzi wa vitu vya kale: Angalia miwani ya duara, umbile linalojirudia, "karibu herufi", na nyuso zenye umbo la plastiki.

Uthabiti wa video: Tumia mbinu za muda au utaona mng'ao na kuteleza kwa fremu kutoka fremu hadi fremu.

Matumizi ya manufaa makubwa: Ikiwa usahihi ni muhimu, onyesha usindikaji na uchukue matokeo kama kielelezo.

Je, uongezaji wa akili bandia (AI) hufanyaje kazi? Infographic.

Huenda umewahi kuiona: picha ndogo, yenye mkunjo hugeuka kuwa kitu kizuri cha kutosha kuchapisha, kutiririsha, au kuachia kwenye uwasilishaji bila kushtuka. Inahisi kama kudanganya. Na - kwa njia bora - ni kama 😅

Kwa hivyo, Jinsi AI Upscaling inavyofanya kazi inategemea kitu maalum zaidi kuliko "kompyuta huboresha maelezo" (kwa mkono) na karibu na "modeli hutabiri muundo unaowezekana wa ubora wa juu kulingana na mifumo ambayo ilijifunza kutoka kwa mifano mingi" (Deep Learning for Image Super-resolution: A Survey). Hatua hiyo ya utabiri ndiyo mchezo mzima - na ndiyo maana upscaling ya AI inaweza kuonekana ya kushangaza… au plastiki kidogo… au kama paka wako alikua na masharubu ya bonasi.

Makala ambazo unaweza kupenda kusoma baada ya hii:

🔗 Jinsi AI inavyofanya kazi
Jifunze misingi ya mifumo, data, na hitimisho katika AI.

🔗 Jinsi AI inavyojifunza
Tazama jinsi data ya mafunzo na maoni yanavyoboresha utendaji wa modeli baada ya muda.

🔗 Jinsi AI inavyogundua kasoro
Elewa misingi ya ruwaza na jinsi AI inavyoashiria tabia isiyo ya kawaida haraka.

🔗 Jinsi AI inavyotabiri mienendo
Chunguza mbinu za utabiri zinazoonyesha ishara na kutabiri mahitaji ya siku zijazo.

Jinsi Upandishaji wa AI unavyofanya kazi: wazo kuu, kwa maneno ya kila siku 🧩

Kuongeza ukubwa kunamaanisha kuongeza ubora: pikseli zaidi, picha kubwa zaidi. Kuongeza ukubwa wa kawaida (kama vile bicubic) kimsingi hunyoosha pikseli na kulainisha mabadiliko (interpolation ya Bicubic). Ni sawa, lakini haiwezi kuvumbua mapya - huingiliana tu.

Kuongeza ukubwa wa akili bandia (AI) hujaribu kitu chenye ujasiri zaidi (pia hujulikana kama "ubora wa hali ya juu" katika ulimwengu wa utafiti) (Deep Learning for Image Super-resolution: A Survey):

Inaangalia ingizo la resi ya chini
Hutambua mifumo (kingo, umbile, sura za uso, mipigo ya maandishi, ufumaji wa kitambaa…)
Hutabiri jinsi toleo la ubora wa juu linapaswa kuonekana
Huzalisha data ya pikseli ya ziada inayolingana na mifumo hiyo

Sio "kurejesha ukweli kikamilifu," zaidi kama "kufanya nadhani inayoaminika sana" (Image Super-Resolution Using Deep Convolutional Networks (SRCNN)). Ikiwa hilo linasikika kama la kutiliwa shaka kidogo, hujakosea - lakini pia ndiyo maana inafanya kazi vizuri sana 😄

Na ndiyo, hii ina maana kwamba kuongeza ukubwa wa akili bandia (AI) kimsingi ni uzushi unaodhibitiwa… lakini kwa njia yenye tija, inayoheshimu pikseli.

Ni nini kinachofanya toleo zuri la upandishaji wa akili bandia (AI) kuwa bora? ✅🛠️

Ukiamua kama mtaalamu wa akili bandia (AI) ndiye anayefanya kazi vizuri zaidi (au mpangilio uliowekwa awali), haya ndiyo mambo yanayowavutia zaidi:

Urejeshaji wa kina bila kupikwa kupita kiasi.
Upanuzi mzuri huongeza ukali na muundo, si kelele kali au vinyweleo bandia.
Nidhamu ya ukingo
Mistari safi hubaki safi. Mifumo mibaya hufanya kingo zitetemeke au kuota kwa halo.
Uhalisia wa Umbile
Nywele hazipaswi kuwa kama brashi ya rangi. Matofali hayapaswi kuwa muhuri wa muundo unaojirudia.
Ushughulikiaji wa Kelele na Mgandamizo
Picha nyingi za kila siku hubadilishwa kuwa JPEG hadi kufa. Msanii mzuri wa hali ya juu hazidishi uharibifu huo (Real-ESRGAN).
Ufahamu wa uso na maandishi
Nyuso na maandishi ndio sehemu rahisi zaidi za kugundua makosa. Mifano mizuri huyashughulikia kwa upole (au yana njia maalum).
Uthabiti katika fremu (kwa video)
Ikiwa maelezo yanabadilisha fremu kutoka fremu hadi fremu, macho yako yatapiga kelele. Video hupandisha au kufa kutokana na uthabiti wa muda (BasicVSR (CVPR 2021)).
Vidhibiti vyenye mantiki
Unataka vitelezi vinavyoelekeza kwenye matokeo halisi: denoise, deblur, kuondolewa kwa vipengee, uhifadhi wa chembe, kunoa… mambo ya vitendo.

Sheria tulivu inayodumu: uongezaji wa "ukubwa" bora mara nyingi ndio ambao hujui sana. Inaonekana tu kama ulikuwa na kamera bora zaidi mwanzoni 📷✨

Jedwali la Ulinganisho: chaguo maarufu za kuongeza ukubwa wa akili bandia (na faida zake) 📊🙂

Hapa chini kuna ulinganisho wa vitendo. Bei ni ngumu kimakusudi kwa sababu zana hutofautiana kulingana na leseni, vifurushi, gharama za hesabu, na mambo yote ya kufurahisha.

Zana / Mbinu	Bora zaidi kwa	Mtazamo wa bei	Kwa nini inafanya kazi (kwa takriban)
Watengenezaji wa hali ya juu wa kompyuta za mezani wa mtindo wa topazi (Picha ya topazi, Video ya topazi)	Picha, video, mtiririko rahisi wa kazi	Kulipwa	Mifumo imara ya jumla + marekebisho mengi, huwa "inafanya kazi tu" ... zaidi
Vipengele vya aina ya Adobe "Super Resolution" (Adobe Enhance > Super Resolution)	Wapiga picha tayari wako katika mfumo huo wa ikolojia	Usajili	Uundaji upya wa maelezo thabiti, kwa kawaida ni wa kihafidhina (usio na msisimko mwingi)
Lahaja za Real-ESRGAN / ESRGAN (Real-ESRGAN, ESRGAN)	DIY, watengenezaji, kazi za kundi	Bure (lakini inagharimu muda)	Nzuri katika umbile lake, inaweza kuwa na viungo kwenye nyuso ikiwa hujali
Hali za kuongeza ukubwa zinazotegemea uenezaji (SR3)	Kazi ya ubunifu, matokeo yaliyopangwa	Imechanganywa	Anaweza kuunda maelezo mazuri - pia anaweza kubuni upuuzi, kwa hivyo ... ndio
Wachezaji wa hali ya juu wa mchezo (mtindo wa DLSS/FSR) (NVIDIA DLSS, AMD FSR 2)	Michezo ya video na uigizaji wa wakati halisi	Imeunganishwa	Hutumia data ya mwendo na mambo ya awali yaliyojifunza - ushindi wa utendaji laini 🕹️
Huduma za kuongeza wingu	Urahisi, ushindi wa haraka	Lipa kwa kila matumizi	Haraka + inaweza kupanuliwa, lakini unabadilisha udhibiti na wakati mwingine ujanja
Watengenezaji wakubwa wa AI wanaolenga video (BasicVSR, Video ya Topaz)	Video za zamani, anime, kumbukumbu	Kulipwa	Mbinu za muda za kupunguza kung'aa kwa mifumo ya video maalum
Simu/matunzio "mahiri" ya kupandisha skeli	Matumizi ya kawaida	Imejumuishwa	Mifumo nyepesi iliyorekebishwa kwa ajili ya matokeo ya kupendeza, si ukamilifu (bado ni rahisi)

Kuunda ukiri wa ajabu: "Paid-ish" inafanya kazi nyingi katika jedwali hilo. Lakini unaelewa 😅

Siri kubwa: wanamitindo hujifunza ramani kutoka kwa ubora wa chini hadi ubora wa juu 🧠➡️🖼️

Katikati ya upandishaji wa juu wa akili bandia (AI) kuna usanidi wa ujifunzaji unaosimamiwa (Image Super-Resolution Using Deep Convolutional Networks (SRCNN)):

Anza na picha zenye ubora wa hali ya juu ("ukweli")
Zipunguze hadi matoleo yenye ubora wa chini ("pembejeo")
Jifunze modeli ya kujenga upya ubora wa juu wa asili kutoka kwa ubora wa chini

Baada ya muda, modeli hujifunza uhusiano kama vile:

"Aina hii ya ukungu kuzunguka jicho kwa kawaida ni ya kope"
"Kundi hili la pikseli mara nyingi huonyesha maandishi ya serif"
"Mteremko huu wa ukingo unaonekana kama mstari wa paa, si kelele ya nasibu"

Sio kukariri picha maalum (kwa maana rahisi), ni kujifunza muundo wa takwimu (Kujifunza kwa Kina kwa Ubora wa Picha: Utafiti). Fikiria kama kujifunza sarufi ya umbile na kingo. Sio sarufi ya ushairi, zaidi kama… sarufi ya mwongozo ya IKEA 🪑📦 (sitiari isiyoeleweka, lakini karibu vya kutosha).

Vidokezo na Vidokezo: kinachotokea wakati wa makadirio (unapofanya vizuri) ⚙️✨

Unapoingiza picha kwenye programu ya AI ya hali ya juu, kwa kawaida huwa na mfumo kama huu:

Usindikaji wa awali
- Badilisha nafasi ya rangi (wakati mwingine)
- Rekebisha thamani za pikseli
- Weka vigae kwenye vipande ikiwa ni vikubwa (angalia uhalisia wa VRAM 😭) (Real-ESRGAN repo (chaguo za vigae))
Uchimbaji wa vipengele
- Tabaka za mapema hugundua kingo, pembe, na gradients
- Tabaka za kina hugundua mifumo: umbile, maumbo, vipengele vya uso
Ujenzi Upya
- Mfano huu hutoa ramani ya vipengele vya ubora wa juu
- Kisha hubadilisha hiyo kuwa matokeo halisi ya pikseli
Baada ya usindikaji
- Kunoa kwa hiari
- Denoise ya hiari
- Ukandamizaji wa hiari wa vitu vya kale (mlio, halos, kizuizi)

Maelezo moja madogo: zana nyingi huwekwa kwenye vigae vya hali ya juu, kisha huchanganya mishono. Zana nzuri huficha mipaka ya vigae. Zana za Meh huacha alama hafifu za gridi ukiziba macho. Na ndio, utaziba macho, kwa sababu wanadamu hupenda kukagua kasoro ndogo kwa kukuza 300% kama gremlins wadogo 🧌

Familia kuu za modeli zinazotumika kwa ajili ya kuongeza ukubwa wa akili bandia (na kwa nini zinahisi tofauti) 🤖📚

1) Ubora wa hali ya juu unaotegemea CNN (kazi ya kawaida)

Mitandao ya neva ya convolutional ni mizuri katika mifumo ya ndani: kingo, umbile, miundo midogo (Image Super-Resolution Using Deep Convolutional Networks (SRCNN)).

Faida: haraka-kama, thabiti, mshangao mdogo
Hasara: inaweza kuonekana "imechakatwa" kidogo ikiwa imesukumwa kwa nguvu

2) Upanuzi wa kiwango unaotegemea GAN (mtindo wa ESRGAN) 🎭

GAN (Mitandao ya Upinzani wa Kizazi) hufunza jenereta kutoa picha zenye ubora wa juu ambazo kibaguzi hawezi kutofautisha na zile halisi (Mitandao ya Upinzani wa Kizazi).

Faida: maelezo ya kuvutia, umbile la kuvutia
Hasara: inaweza kubuni maelezo ambayo hayakuwepo - wakati mwingine si sahihi, wakati mwingine ya ajabu (SRGAN, ESRGAN)

GAN inaweza kukupa ukali unaostahili mshangao. Inaweza pia kumpa mhusika wako picha nyusi za ziada. Kwa hivyo… chagua vita vyako 😬

3) Upanuzi wa kiwango unaotegemea usambazaji (kadi ya ubunifu) 🌫️➡️🖼️

Mifumo ya uenezaji huondoa kelele hatua kwa hatua na inaweza kuongozwa ili kutoa maelezo ya ubora wa juu (SR3).

Faida: inaweza kuwa nzuri sana katika maelezo yanayowezekana, hasa kwa kazi ya ubunifu
Hasara: inaweza kupotoka kutoka kwa utambulisho/muundo wa asili ikiwa mipangilio ni ya fujo (SR3)

Hapa ndipo "kuongeza ukubwa" huanza kuchanganyika na "kufikiria upya." Wakati mwingine ndivyo hasa unavyotaka. Wakati mwingine sivyo.

4) Kuongeza ukubwa wa video kwa uthabiti wa muda 🎞️

Kuongeza ukubwa wa video mara nyingi huongeza mantiki inayozingatia mwendo:

Hutumia fremu za jirani ili kuimarisha maelezo (BasicVSR (CVPR 2021))
Hujaribu kuepuka vitu vinavyoweza kung'aa na kutambaa
Mara nyingi huchanganya ubora wa hali ya juu na denoise na deinterlacing (Topaz Video)

Ikiwa kuongeza ukubwa wa picha ni kama kurejesha uchoraji mmoja, kuongeza ukubwa wa video ni kama kurejesha kitabu cha picha bila kufanya pua ya mhusika ibadilishe umbo kila ukurasa. Ambayo ni ... ngumu kuliko inavyosikika.

Kwa nini upandishaji wa akili bandia wakati mwingine huonekana kama bandia (na jinsi ya kuutambua) 👀🚩

Upandishaji wa akili bandia (AI) hushindwa kutambulika kwa njia zinazotambulika. Ukishajifunza mifumo hiyo, utaiona kila mahali, kama vile kununua gari jipya na ghafla kugundua modeli hiyo kila mtaa 😵💫

Mazungumzo ya kawaida:

Ngozi ya nta kwenye nyuso (kupunguza kelele kupita kiasi + kulainisha)
Halo zenye ncha kali kupita kiasi kuzunguka kingo (eneo la kawaida la "kuzidisha") (Utafsiri wa Bicubic)
Maumbile yanayorudiwa (kuta za matofali huwa mifumo ya kunakili-kubandika)
Tofauti ndogo ndogo inayopiga kelele "algorithm"
Kuharibika kwa maandishi ambapo herufi huwa karibu herufi (aina mbaya zaidi)
Mtiririko wa kina ambapo vipengele vidogo hubadilika kwa njia fiche, hasa katika mtiririko wa kazi wa usambazaji (SR3)

Sehemu ngumu: wakati mwingine vitu hivi vya kale huonekana "bora zaidi" kwa mtazamo wa kwanza. Ubongo wako unapenda ukali. Lakini baada ya muda mfupi, unahisi ... haupo sawa.

Mbinu nzuri ni kuongeza ukubwa wa picha na kuangalia kama inaonekana ya asili kwa umbali wa kawaida wa kutazama. Ikiwa inaonekana nzuri kwa 400% tu, hiyo si ushindi, hiyo ni burudani 😅

Jinsi Upandishaji wa AI unavyofanya kazi: upande wa mafunzo, bila maumivu ya kichwa cha hesabu 📉🙂

Mafunzo ya mifumo ya ubora wa juu kwa kawaida huhusisha:

Seti za data zilizooanishwa (pembejeo ya ubora wa chini, shabaha ya ubora wa juu) (Ubora wa Picha kwa Kutumia Mitandao ya Kina ya Kubadilisha (SRCNN))
Vipengele vya upotevu vinavyoadhibu ujenzi upya usiofaa (SRGAN)

Aina za kawaida za hasara:

Kupoteza pikseli (L1/L2)
Huhimiza usahihi. Inaweza kutoa matokeo laini kidogo.
Upotevu wa utambuzi
Hulinganisha vipengele vya ndani zaidi (kama "hii inaonekana sawa") badala ya pikseli halisi (Upotevu wa utambuzi (Johnson et al., 2016)).
Upotevu wa wapinzani (GAN)
Huhimiza uhalisia, wakati mwingine kwa gharama ya usahihi halisi (SRGAN, Mitandao ya Upinzani ya Uzalishaji).

Kuna vita vya mara kwa mara:

Ifanye iwe mwaminifu kwa asili
dhidi ya
Ifanye iwe ya kupendeza macho

Zana tofauti huangukia katika sehemu tofauti kwenye wigo huo. Na unaweza kupendelea moja kulingana na kama unarejesha picha za familia au unaandaa bango ambapo "mwonekano mzuri" ni muhimu zaidi kuliko usahihi wa kiuchunguzi.

Mtiririko wa kazi kwa vitendo: picha, skani za zamani, anime, na video 📸🧾🎥

Picha (picha, mandhari, picha za bidhaa)

Mbinu bora kwa kawaida ni:

Kwanza, kelele kidogo (ikiwa inahitajika)
Imeboreshwa kwa mipangilio ya kihafidhina
Ongeza nafaka tena ikiwa mambo yanahisi laini sana (ndio, kweli)

Nafaka ni kama chumvi. Chakula cha jioni kimeharibika sana, lakini hakuna hata kimoja kinachoweza kuwa laini kidogo 🍟

Skani za zamani na picha zilizobanwa sana

Hizi ni ngumu zaidi kwa sababu modeli inaweza kutibu vizuizi vya mgandamizo kama "muundo."
Jaribu:

Kuondoa au kuondoa kizuizi cha vitu bandia
Kisha ya hali ya juu
Kisha mwanga unanoa (sio sana ... najua, kila mtu anasema hivyo, lakini bado)

Anime na sanaa ya mstari

Sanaa ya mstari ina faida kutoka:

Mifano inayohifadhi kingo safi
Umbile lililopunguzwa la ndoto
Kuongeza ukubwa wa Anime mara nyingi huonekana vizuri kwa sababu maumbo ni rahisi na thabiti. (Bahati nzuri.)

Video

Video inaongeza hatua za ziada:

Kelele ya Denoise
Deinterlace (kwa vyanzo fulani)
Kipana
Kulainisha au kutuliza kwa muda (BasicVSR (CVPR 2021))
Uanzishaji upya wa nafaka kwa ajili ya mshikamano wa hiari

Ukiruka uthabiti wa muda, unapata sehemu hiyo inayong'aa ikibadilika. Ukiiona, huwezi kuiondoa. Kama kiti kinacholia katika chumba tulivu 😖

Kuchagua mipangilio bila kubahatisha kwa njia isiyo ya kawaida (karatasi ndogo ya kudanganya) 🎛️😵💫

Hapa kuna mawazo mazuri ya kuanzia:

Ikiwa nyuso zinaonekana za plastiki
Punguza kelele, punguza kunoa, jaribu modeli au hali inayohifadhi uso.
Ikiwa umbile linaonekana kali sana.
Vitelezi vya "uboreshaji wa maelezo" au "rejesha maelezo", ongeza chembe ndogo baada ya hapo.
Ikiwa kingo zinang'aa,
punguza kunoa, angalia chaguo za kukandamiza halo.
Ikiwa picha inaonekana "AI" sana,
fanya mambo ya kihafidhina zaidi. Wakati mwingine hatua bora ni ... kidogo tu.

Pia: usitumie 8x ya hali ya juu kwa sababu tu unaweza. 2x safi au 4x mara nyingi ndio sehemu nzuri. Zaidi ya hapo, unamwomba modeli aandike hadithi za mashabiki kuhusu pikseli zako 📖😂

Maadili, uhalisia, na swali gumu la "ukweli" 🧭😬

Kuongeza ukubwa wa akili bandia (AI) kunafifisha mstari:

Urejesho unamaanisha kurejesha kile kilichokuwapo
Uboreshaji unamaanisha kuongeza kile ambacho hakikuwa

Kwa picha za kibinafsi, kwa kawaida ni sawa (na nzuri). Kwa uandishi wa habari, ushahidi wa kisheria, picha za kimatibabu, au kitu chochote kinachohusu uaminifu... unahitaji kuwa mwangalifu (OSAC/NIST: Mwongozo wa Kawaida wa Usimamizi wa Picha za Kidijitali za Kiuchunguzi, Miongozo ya SWGDE ya Uchambuzi wa Picha za Kiuchunguzi).

Kanuni rahisi:

Ikiwa hatari ni kubwa, chukulia uongezaji wa AI kama kielelezo, si cha uhakika.

Pia, ufichuzi ni muhimu katika miktadha ya kitaaluma. Si kwa sababu AI ni mbaya, bali kwa sababu hadhira inastahili kujua kama maelezo yalijengwa upya au yalinaswa. Hiyo ni heshima tu.

Maelezo ya kumalizia na muhtasari mfupi 🧡✅

Kwa hivyo, Jinsi Upandishaji wa AI unavyofanya kazi ni hivi: modeli hujifunza jinsi maelezo ya ubora wa juu yanavyohusiana na ruwaza za ubora wa chini, kisha hutabiri pikseli za ziada zinazoaminika wakati wa upandishaji wa ubora (Deep Learning for Image Super-resolution: A Survey). Kulingana na familia ya modeli (CNN, GAN, diffusion, video-temporal), utabiri huo unaweza kuwa wa kihafidhina na wa uaminifu… au wa ujasiri na wakati mwingine usio na kikwazo 😅

Muhtasari wa haraka

Pikseli za kawaida za kunyoosha kwa kiwango cha juu (Kiingilio cha Bicubic)
Upanuzi wa AI hutabiri maelezo yanayokosekana kwa kutumia mifumo iliyojifunza (Image Super-Resolution Using Deep Convolutional Networks (SRCNN))
Matokeo mazuri hutokana na mfumo sahihi + kizuizi
Tazama halo, nyuso zenye nta, umbile linalojirudia, na kung'aa kwenye video (BasicVSR (CVPR 2021))
Kuongeza ukubwa mara nyingi ni "ujenzi unaowezekana," si ukweli kamili (SRGAN, ESRGAN)

Ukitaka, niambie unachoongeza ukubwa (nyuso, picha za zamani, video, anime, maandishi yaliyochanganuliwa), nami nitapendekeza mkakati wa mipangilio unaoelekea kuepuka mitego ya kawaida ya "mwonekano wa AI" 🎯🙂

Mfano halisi: Kuongeza ukubwa wa picha za bidhaa za soko la zamani 📸

Hali

Duka dogo la kamera za mitumba lina picha 40 za bidhaa zilizosafirishwa kutoka tovuti ya zamani zenye upana wa pikseli 800. Mmiliki anataka kuzitumia tena kwenye ukurasa mpya wa biashara ya mtandaoni, ambapo ukubwa wa picha unaopendekezwa ni upana wa pikseli 1,600.

Tatizo: kubadilisha ukubwa wa kawaida hufanya kamera zionekane laini, huku uongezaji wa kasi wa akili bandia (AI) kwa nguvu unaweza kufanya vishikio vya mpira, nambari za mfululizo, na alama za lenzi zionekane bandia kwa kutiliwa shaka. Hilo ni muhimu kwa sababu wanunuzi hutegemea maelezo hayo kabla ya kununua.

Lengo si "kurejesha" taarifa zinazokosekana kikamilifu. Ni kuunda picha safi zaidi za orodha huku ukiweka faili asili zinapatikana, kwa sababu upandishaji wa kiwango cha akili bandia (AI) hutabiri maelezo yanayowezekana badala ya ukweli uliohakikishwa.

Kinachohitajika katika mtiririko wa kazi

Picha za bidhaa asili, ikiwezekana matoleo yaliyobanwa kidogo zaidi yanayopatikana

Ukubwa wa matokeo lengwa, kama vile upana wa 2× kutoka 800px hadi 1,600px

Zana au modeli yenye vidhibiti tofauti vya kuondoa kelele, kunoa, na kuondoa vitu vya kale

Orodha rahisi ya ukaguzi wa maandishi, kingo, nembo, skrubu, vifungo, chembe za ngozi, na uakisi

Folda ya nakala asili na folda tofauti ya uhamishaji uliohaririwa, kwa hivyo hakuna kinachoweza kuandikwa tena

Mfano wa maelekezo

Tumia aina hii ya maelekezo unapojaribu programu ya AI ya hali ya juu:

Ongeza ukubwa wa picha hii ya bidhaa kwa 2× kwa ajili ya orodha ya biashara mtandaoni. Weka umbo la kitu, uwekaji wa nembo, alama za lenzi, kingo za vitufe, na umbile la uso karibu na asili iwezekanavyo. Tumia usafishaji mdogo wa kubana, kunoa kidogo, na epuka kuvumbua maandishi ya ziada, mikwaruzo, lebo, nambari za mfululizo, au maelezo ya mapambo. Picha ya mwisho inapaswa kuonekana ya asili katika ukubwa wa kawaida wa ukurasa wa bidhaa, isiwe kali bandia katika ukuzaji wa 400%.

Jinsi ya kuijaribu

Anza na picha tano mchanganyiko kabla ya kusindika kundi zima:

Picha moja safi ya bidhaa yenye mwanga mzuri

Picha moja iliyobanwa ya JPEG yenye kizuizi

Picha moja yenye maandishi madogo yaliyochapishwa au alama za lenzi

Picha moja nyeusi yenye kelele kwenye vivuli

Picha moja yenye metali au kioo kinachoakisi

Baada ya kuongeza ukubwa, linganisha kila matokeo dhidi ya asili kwa 100% na 200%. Angalia kama majina ya chapa, piga, skrubu, milango, na mifumo ya umbile bado inalingana. Ikiwa modeli inaunda "karibu herufi" au alama bandia za uso, punguza mpangilio wa kunoa au urejeshaji wa maelezo.

Matokeo

Matokeo ya kielelezo: kulingana na muda wa jaribio la picha tano kabla na baada ya kutumia mtiririko huu wa kazi.

Kusafisha na kubadilisha ukubwa kwa mikono kulichukua takriban dakika 9 kwa kila picha, au dakika 45 kwa picha tano.

Mtiririko wa kazi uliosaidiwa na AI ulichukua takriban dakika 3 kwa kila picha, au dakika 15 kwa picha tano.

Hiyo ni takriban dakika 30 zilizohifadhiwa kwenye picha tano, au takriban saa 4 zilizohifadhiwa kwenye kundi la picha 40.

Matokeo ya ukaguzi wa ubora: Picha 4 kati ya 5 zilipita ukaguzi wa kwanza. Picha moja ilishindwa kwa sababu lenzi ya hali ya juu ilipotosha maandishi madogo ya lenzi, kwa hivyo ilichakatwa tena kwa kunoa kidogo na hakuna uboreshaji wa maandishi.

Kipimo muhimu hapa si tu "inaonekana kuwa na umbo zuri zaidi". Ni: ni picha ngapi zinazopita ukaguzi wa kando bila maelezo yaliyobuniwa?

Ni nini kinachoweza kwenda vibaya

Mfano unaweza kugeuza vumbi, vizuizi vya JPEG, au mikwaruzo kuwa umbile "halisi".

Maandishi madogo yanaweza kuwa maandishi bandia ambayo yanaonekana kuaminika hadi unapovuta zaidi.

Denoise nyingi sana inaweza kufanya mpira, ngozi, au chuma kilichopigwa brashi kuonekana kama nta.

Kunoa kwa nguvu kunaweza kuunda halos kuzunguka kingo za bidhaa.

Usindikaji wa kundi unaweza kuficha makosa, kwa hivyo kagua sampuli kabla ya kusafirisha kila kitu.

Kwa biashara ya mtandaoni, kanuni salama zaidi ni rahisi: usitumie kamwe upandishaji wa akili bandia (AI) kuficha uharibifu, kubadilisha hali, au kufanya bidhaa ionekane mpya kuliko ilivyo.

Kuchukua kwa vitendo

Kuongeza ukubwa wa akili bandia hufanya kazi vizuri zaidi unapoichukulia kama hatua ya kumalizia iliyodhibitiwa, si kitufe cha kurekebisha kichawi. Tumia mipangilio ya kihafidhina ya 2×, angalia maelezo ambayo wanunuzi wanajali, na uendelee na picha asili ili toleo lililohaririwa liendelee kuaminika.

Mfano halisi: Kuongeza ukubwa wa video ya mafunzo ya zamani bila kuifanya ing'ae

Hali

Kampuni ndogo ya mafunzo ina video ya maonyesho ya usalama ya dakika 7 iliyorekodiwa mwaka wa 2014 kwa 720p. Maudhui bado yana thamani, lakini video inaonekana laini kwenye tovuti mpya ya kampuni, hasa kwenye skrini kubwa za kompyuta mpakato.

Timu inataka kusafirisha toleo safi la 1080p bila kupiga picha upya. Hatari ni kwamba upandishaji wa kasi wa AI unaweza kufanya nyuso zionekane kama nta, kugeuza maandishi kwenye ishara kuwa "karibu maneno", au kuunda umbile linalong'aa kutoka fremu hadi fremu.

Lengo si kuifanya video ionekane mpya kabisa. Ni kuifanya iwe wazi zaidi, thabiti, na isiyobanwa sana huku ikiweka uso wa mwalimu, lebo za onyo, mienendo ya mikono, na maelezo ya vifaa kuwa sahihi kulingana na ile ya awali.

Kinachohitajika katika mtiririko wa kazi

Faili halisi ya video, si upakuaji uliobanwa kwenye mitandao ya kijamii ikiwezekana

Ukubwa lengwa wa usafirishaji, kama vile 720p hadi 1080p badala ya kuruka moja kwa moja hadi 4K

Video ya kisasa yenye denoise, kunoa, kurekebisha mgandamizo, na chaguo za uthabiti wa muda

Kipande kifupi cha majaribio chenye nyuso, mwendo, maandishi, na nyuso zenye maelezo

Orodha ya ukaguzi wa kung'aa, halo, maandishi yaliyopotoka, umbile la uso, na kingo zinazosogea

Nakala iliyohifadhiwa ya video asili kwa ajili ya kulinganisha na kufichua inapohitajika

Mfano wa maelekezo

Tumia aina hii ya maelekezo kabla ya kuchakata video nzima:

Ongeza video hii ya mafunzo ya 720p hadi 1080p. Weka kipaumbele katika mwendo wa asili, kingo thabiti, maandishi yaliyopo yanayoweza kusomeka, na umbile halisi la ngozi. Tumia ukarabati mdogo wa kubana na kunoa kidogo. Usivumbue maandishi, nembo, lebo, mikwaruzo, maelezo ya uso, au alama za vifaa zinazokosekana. Epuka kung'aa kutoka fremu hadi fremu. Matokeo ya mwisho yanapaswa kuonekana wazi zaidi katika ukubwa wa kawaida wa kutazama, si mkali bandia unaposimamishwa na kukuzwa.

Jinsi ya kuijaribu

Kabla ya kuchakata faili kamili ya dakika 7, tuma sampuli ya sekunde 20 ambayo inajumuisha:

Uso wa mwalimu alipokuwa akizungumza

Mkono ukitembea kwenye fremu

Lebo ya onyo au maandishi madogo yaliyochapishwa

Sehemu yenye umbile, kama vile kitambaa, zege, chuma kilichopigwa brashi, au plastiki

Kikaangio cha kamera au mwendo wowote unaotetemeka

Tazama sampuli mara mbili: mara moja kwa kasi ya kawaida na mara moja umesitisha fremu kwa fremu. Kwa kasi ya kawaida, tafuta mng'ao, umbile linalotambaa, au mwendo usio wa kawaida kuzunguka kingo. Unapositisha, linganisha matoleo asili na yale ya hali ya juu ili kuangalia kama maandishi, vitufe, zana, na vipengele vya uso bado vinalingana.

Matokeo

Matokeo ya kielelezo: kulingana na kuweka muda kwenye kipande kimoja cha jaribio cha sekunde 20 na kisha kutumia mipangilio hiyo hiyo kwenye video ya dakika 7.

Mtiririko wa kazi wa "kurekebisha ukubwa na kunoa" kwa mikono ulichukua kama dakika 35, ikijumuisha usafirishaji na ukaguzi, lakini matokeo yalionyesha mng'ao unaoonekana kwenye nywele za mwalimu na halos karibu na alama za usalama.

Mtiririko wa kazi uliosaidiwa na AI ulichukua takriban dakika 55 ikijumuisha majaribio ya mauzo nje, lakini ulipunguza matatizo ya ukaguzi kutoka matatizo 8 yanayoonekana katika mauzo nje ya kwanza hadi matatizo 2 madogo katika mauzo nje ya mwisho.

Toleo la mwisho lilipitisha ukaguzi 10 kati ya 12 kwenye orodha ya ukaguzi. Masuala mawili yaliyobaki yalikuwa ulaini kidogo kwenye maandishi ya usuli na kelele kidogo katika kona moja nyeusi. Zote mbili zilikubaliwa kwa sababu mwalimu, vifaa, na hatua za usalama zilibaki sawa machoni.

Kipimo chenye maana hapa si "mafanikio ya 1080p". Ni: ni sekunde ngapi za kipindi cha video kinachoonyesha vitu vya kale vinavyovuruga wakati wa uchezaji wa kawaida?

Ni nini kinachoweza kwenda vibaya

Mfano huo unaweza kunoa vitalu vya kubana na kuvifanya vionekane kama umbile halisi.

Maandishi mazuri yanaweza kuonekana ya kujiamini zaidi lakini yasiyo sahihi.

Nyuso zinaweza kuwa laini sana ikiwa kelele ya denoise ni kubwa sana.

Kingo zinazosogea zinaweza kung'aa ikiwa kifaa kitashughulikia kila fremu kwa kujitegemea sana.

Usafirishaji wa 4K unaweza kuonekana mbaya zaidi kuliko usafirishaji wa 1080p uliozuiliwa kwa sababu modeli hiyo inapaswa kubuni maelezo mengi sana.

Kosa kubwa zaidi ni kuhukumu fremu iliyositishwa pekee. Kuongeza ukubwa wa video kunapaswa kuonekana kwa njia ya asili katika mwendo, si kwa kuvutia tu kama picha tuli.

Kuchukua kwa vitendo

Kwa video, upandishaji wa AI hufanya kazi vizuri zaidi unapojaribu sehemu fupi kwanza, weka ubora wa hali ya juu wa wastani, na uhukumu mwendo kabla ya ukali. Matokeo laini kidogo lakini thabiti kwa kawaida huwa bora kuliko toleo laini linalong'aa kila wakati mtu anaposogea.

Maswali Yanayoulizwa Mara kwa Mara

Kuongeza ukubwa wa akili bandia na jinsi inavyofanya kazi

Upanuzi wa akili bandia (mara nyingi huitwa "ubora wa hali ya juu") huongeza ubora wa picha kwa kutabiri maelezo yasiyo na ubora wa hali ya juu kutoka kwa mifumo iliyojifunza wakati wa mafunzo. Badala ya kunyoosha tu pikseli kama vile uingiliaji kati wa bicubic, modeli huchunguza kingo, umbile, nyuso, na mipigo kama maandishi, kisha hutoa data mpya ya pikseli inayolingana na mifumo hiyo iliyojifunza. Ni "kurejesha uhalisia" kidogo zaidi bali "kufanya kisio linaloaminika" linalosomeka kama la asili.

Kuongeza ukubwa wa akili bandia dhidi ya kupunguza ukubwa wa bicubic au wa kitamaduni

Mbinu za kitamaduni za kuongeza ukubwa (kama vile bicubic) huingiliana hasa kati ya pikseli zilizopo, na kulainisha mabadiliko bila kuunda maelezo mapya halisi. Kuongeza ukubwa wa akili bandia (AI) kunalenga kujenga upya muundo unaowezekana kwa kutambua ishara za kuona na kutabiri jinsi matoleo ya ishara hizo zenye ubora wa juu yanavyoonekana. Ndiyo maana matokeo ya akili bandia yanaweza kuhisi kuwa makali zaidi, na pia kwa nini yanaweza kuanzisha mabaki au "kuvumbua" maelezo ambayo hayakuwepo kwenye chanzo.

Kwa nini nyuso zinaweza kuonekana kama nta au laini kupita kiasi

Nyuso zenye nta kwa kawaida hutokana na kuondoa kelele kwa nguvu na kulainisha pamoja na kunoa kunakoondoa umbile asilia la ngozi. Vifaa vingi hushughulikia kelele na umbile laini vivyo hivyo, kwa hivyo "kusafisha" picha kunaweza kufuta vinyweleo na maelezo madogo. Mbinu ya kawaida ni kupunguza kuondoa kelele na kunoa, tumia hali ya kuhifadhi uso ikiwa inapatikana, kisha rudisha mguso wa chembe ili matokeo yasionekane ya plastiki sana na ya picha zaidi.

Mabaki ya kawaida ya kuongeza ukubwa wa akili bandia ya kutazama

Vielelezo vya kawaida hujumuisha halo zinazozunguka kingo, mifumo inayorudiwa ya umbile (kama vile matofali ya kunakili-kubandika), utofautishaji mdogo unaoganda, na maandishi ambayo hubadilika kuwa "karibu herufi." Katika mtiririko wa kazi unaotegemea uenezaji, unaweza pia kuona mkondo wa maelezo ambapo vipengele vidogo hubadilika kwa upole. Kwa video, maelezo yanayopeperuka na kutambaa kwenye fremu ni bendera kubwa nyekundu. Ikiwa inaonekana nzuri tu katika ukuzaji uliokithiri, mipangilio labda ni kali sana.

Jinsi GAN, CNN, na watangazaji wapya wanavyotofautiana katika matokeo

Ubora wa juu unaotegemea CNN huwa thabiti na unaotabirika zaidi, lakini unaweza kuonekana "umechakatwa" ukisukumwa kwa nguvu. Chaguo zinazotegemea GAN (mtindo wa ESRGAN) mara nyingi hutoa umbile lenye nguvu zaidi na ukali unaoonekana, lakini zinaweza kufichua maelezo yasiyo sahihi, haswa kwenye nyuso. Upanuzi unaotegemea usambazaji unaweza kutoa maelezo mazuri na yanayowezekana, lakini unaweza kupotoka kutoka kwa muundo wa asili ikiwa mipangilio ya mwongozo au nguvu ni imara sana.

Mkakati wa mipangilio ya vitendo ya kuepuka mwonekano wa "AI sana"

Anza kwa mtindo wa kihafidhina: 2× au 4× ya hali ya juu kabla ya kufikia mambo yaliyokithiri. Ikiwa nyuso zinaonekana kama plastiki, piga kelele nyuma na kunoa na ujaribu hali inayotambua uso. Ikiwa umbile linazidi kuwa kali, punguza uboreshaji wa maelezo na fikiria kuongeza chembe ndogo baadaye. Ikiwa kingo zinang'aa, punguza kunoa na angalia ukandamizaji wa halo au bandia. Katika mifumo mingi, "chini" hushinda kwa sababu huhifadhi uhalisia unaoaminika.

Kushughulikia skani za zamani au picha zilizobanwa sana na JPEG kabla ya kuongeza ukubwa

Picha zilizobanwa ni ngumu kwa sababu mifumo inaweza kutibu mabaki ya vitalu kama umbile halisi na kuyaongeza. Mtiririko wa kazi wa kawaida ni kuondoa au kuondoa vizuizi vya mabaki kwanza, kisha kuongeza ukubwa, kisha kunoa mwangaza tu inapohitajika. Kwa uchanganuzi, usafishaji mpole unaweza kusaidia mfumo kuzingatia muundo halisi badala ya uharibifu. Lengo ni kupunguza "viashiria bandia vya umbile" ili mtaalamu asilazimike kufanya ubashiri wa kujiamini kutokana na ingizo zenye kelele.

Kwa nini kuongeza ukubwa wa video ni vigumu kuliko kuongeza ukubwa wa picha

Upandishaji wa video lazima uwe sawa katika fremu, si mzuri tu kwenye picha moja tuli. Ikiwa maelezo yanabadilika kutoka fremu hadi fremu, matokeo yake yanavuruga haraka. Mbinu zinazolenga video hutumia taarifa za muda kutoka kwa fremu za jirani ili kuimarisha ujenzi upya na kuepuka mabaki yanayong'aa. Mifumo mingi ya kazi pia inajumuisha denoise, deinterlacing kwa vyanzo fulani, na uanzishaji upya wa nafaka hiari ili mfuatano mzima uhisike kuwa na mshikamano badala ya kuwa mkali bandia.

Wakati kuongeza ukubwa wa akili bandia (AI) si sahihi au ni hatari kutegemea

Kuongeza ukubwa wa akili bandia (AI) huchukuliwa vyema kama uboreshaji, si uthibitisho. Katika miktadha mikubwa kama vile uandishi wa habari, ushahidi wa kisheria, upigaji picha wa kimatibabu, au kazi ya uchunguzi wa kimatibabu, kutoa pikseli "zinazoaminika" kunaweza kupotosha kwa sababu kunaweza kuongeza maelezo ambayo hayakunaswa. Muundo salama zaidi ni kuutumia kwa njia ya kielelezo na kufichua kwamba mchakato wa akili bandia uliunda upya maelezo. Ikiwa uaminifu ni muhimu, hifadhi asili na uandike kila hatua na mpangilio wa usindikaji.

Marejeleo

arXiv - Kujifunza kwa Kina kwa Ubora wa Picha: Utafiti - arxiv.org
arXiv - Ubora wa Picha kwa Kutumia Mitandao ya Kina ya Ubadilishaji (SRCNN) - arxiv.org
arXiv - Real-ESRGAN - arxiv.org
arXiv - ESRGAN - arxiv.org
arXiv - SR3 - arxiv.org
Msanidi Programu wa NVIDIA - NVIDIA DLSS - developer.nvidia.com
AMD GPUOpen - FidelityFX Super Resolution 2 - gpuopen.com
Wakfu wa Maono ya Kompyuta (CVF) Ufikiaji Huria - BasicVSR: Utafutaji wa Vipengele Muhimu katika Ubora wa Video (CVPR 2021) - openaccess.thecvf.com
arXiv - Mitandao ya Upinzani Inayozalisha - arxiv.org
arXiv - SRGAN - arxiv.org
arXiv - Upotevu wa Utambuzi (Johnson et al., 2016) - arxiv.org
GitHub - Repo Halisi ya ESRGAN (chaguo za vigae) - github.com
Wikipedia - Tafsiri ya Bicubic - wikipedia.org
Maabara ya Topaz - Picha ya Topaz - topazlabs.com
Maabara ya Topaz - Video ya Topaz - topazlabs.com
Kituo cha Usaidizi cha Adobe - Adobe Enhance > Super Resolution - helpx.adobe.com
NIST / OSAC - Mwongozo wa Kawaida wa Usimamizi wa Picha za Kidijitali za Kiuchunguzi (Toleo la 1.0) - nist.gov
SWGDE - Miongozo ya Uchambuzi wa Picha za Kiuchunguzi - swgde.org

Pata Akili ya Kielektroniki ya Hivi Punde katika Duka Rasmi la Msaidizi wa Akili ya Kielektroniki

Kuhusu Sisi

Rudi kwenye blogu

Jinsi Upandishaji wa AI unavyofanya kazi: wazo kuu, kwa maneno ya kila siku 🧩

Ni nini kinachofanya toleo zuri la upandishaji wa akili bandia (AI) kuwa bora? ✅🛠️

Jedwali la Ulinganisho: chaguo maarufu za kuongeza ukubwa wa akili bandia (na faida zake) 📊🙂

Siri kubwa: wanamitindo hujifunza ramani kutoka kwa ubora wa chini hadi ubora wa juu 🧠➡️🖼️

Vidokezo na Vidokezo: kinachotokea wakati wa makadirio (unapofanya vizuri) ⚙️✨

Familia kuu za modeli zinazotumika kwa ajili ya kuongeza ukubwa wa akili bandia (na kwa nini zinahisi tofauti) 🤖📚

1) Ubora wa hali ya juu unaotegemea CNN (kazi ya kawaida)

2) Upanuzi wa kiwango unaotegemea GAN (mtindo wa ESRGAN) 🎭

3) Upanuzi wa kiwango unaotegemea usambazaji (kadi ya ubunifu) 🌫️➡️🖼️

4) Kuongeza ukubwa wa video kwa uthabiti wa muda 🎞️

Kwa nini upandishaji wa akili bandia wakati mwingine huonekana kama bandia (na jinsi ya kuutambua) 👀🚩

Jinsi Upandishaji wa AI unavyofanya kazi: upande wa mafunzo, bila maumivu ya kichwa cha hesabu 📉🙂

Mtiririko wa kazi kwa vitendo: picha, skani za zamani, anime, na video 📸🧾🎥

Picha (picha, mandhari, picha za bidhaa)

Skani za zamani na picha zilizobanwa sana

Anime na sanaa ya mstari

Video

Kuchagua mipangilio bila kubahatisha kwa njia isiyo ya kawaida (karatasi ndogo ya kudanganya) 🎛️😵💫

Maadili, uhalisia, na swali gumu la "ukweli" 🧭😬

Maelezo ya kumalizia na muhtasari mfupi 🧡✅

Mfano halisi: Kuongeza ukubwa wa picha za bidhaa za soko la zamani 📸

Hali

Kinachohitajika katika mtiririko wa kazi

Mfano wa maelekezo

Jinsi ya kuijaribu

Matokeo

Ni nini kinachoweza kwenda vibaya

Kuchukua kwa vitendo

Mfano halisi: Kuongeza ukubwa wa video ya mafunzo ya zamani bila kuifanya ing'ae

Hali

Kinachohitajika katika mtiririko wa kazi

Mfano wa maelekezo

Jinsi ya kuijaribu

Matokeo

Ni nini kinachoweza kwenda vibaya

Kuchukua kwa vitendo

Maswali Yanayoulizwa Mara kwa Mara

Kuongeza ukubwa wa akili bandia na jinsi inavyofanya kazi

Kuongeza ukubwa wa akili bandia dhidi ya kupunguza ukubwa wa bicubic au wa kitamaduni

Kwa nini nyuso zinaweza kuonekana kama nta au laini kupita kiasi

Mabaki ya kawaida ya kuongeza ukubwa wa akili bandia ya kutazama

Jinsi GAN, CNN, na watangazaji wapya wanavyotofautiana katika matokeo

Mkakati wa mipangilio ya vitendo ya kuepuka mwonekano wa "AI sana"

Kushughulikia skani za zamani au picha zilizobanwa sana na JPEG kabla ya kuongeza ukubwa

Kwa nini kuongeza ukubwa wa video ni vigumu kuliko kuongeza ukubwa wa picha

Wakati kuongeza ukubwa wa akili bandia (AI) si sahihi au ni hatari kutegemea

Marejeleo

Pata Akili ya Kielektroniki ya Hivi Punde katika Duka Rasmi la Msaidizi wa Akili ya Kielektroniki

Kuhusu Sisi

Maswali Yanayoulizwa Mara kwa Mara Zaidi

Je, uongezaji wa ukubwa wa akili bandia (AI) unatofautianaje na mbinu za jadi za kubadilisha ukubwa?

Ni mabaki gani ya kawaida ambayo ninapaswa kuangalia ninapotumia upandishaji wa upangaji wa akili bandia (AI)?

Kwa nini nyuso wakati mwingine huonekana laini sana au zisizo za kweli baada ya kupandishwa?

Nifanye nini ikiwa picha zangu zinaonekana kuwa ngumu au zina kelele nyingi baada ya kutumia upandishaji wa juu wa akili bandia (AI)?

Je, mifano ya GAN na CNN inalinganishwaje katika matokeo ya kuongeza ukubwa wa akili bandia (AI)?

Je, upandishaji wa akili bandia (AI) unafaa kwa maudhui ya video, na unaleta changamoto gani?

Ni lini haifai kutegemea uongezaji wa akili bandia (AI)?

Ni mambo gani ninayopaswa kuzingatia ninapoongeza ukubwa wa picha zilizobanwa sana?