Ukrainas YouTube karte: aizraujošs digitālās pasaules atklājums

Talantīgs izstrādātājs, kurš darbojas ar pseidonīmu DAO, ir radījis patiesi iespaidīgu projektu – interaktīvu karti, kas aptver visu ukraiņu YouTube ainavu. Šī kartēšana iepazīstina ar vairāk nekā 10 000 ukraiņu valodā veidotiem kanāliem, kas ir rūpīgi sadalīti tematisko “kontinentos”. Imaginējiet digitālu pasauli, kur katra sīka detaļa ir pārdomāta un sakārtota.

Izprast digitālo saturu: kategorijas un klāsteri

Kartes struktūra ir ne tikai funkcionāla, bet arī ļoti intuitīva. Kanāli ir organizēti plašā kategoriju klāstā, sākot no aizraujošām videospēlēm un sporta pārraidēm, līdz pat svarīgām ziņām un politikas analīzei, kā arī saturam jaunākajiem lasītājiem un grāmatu mīļotājiem. Pat tehnoloģiju entuziasti un IT profesionāļi atradīs sev interesējošos kanālus, jo aptverts praktiski viss, ko ukraiņu YouTube piedāvā. Kā skaidro pats DAO, “katrs aplis uz šīs kartes ir atsevišķs kanāls, un tā izmērs atspoguļo abonentu skaitu. Visi kanāli ir sadalīti tematiski grupās un tā dēvētajos klāsteros, kur varat redzēt gan pašu kanālu, gan tā ‘kaimiņus’.” Šī vizuālā pieeja palīdz saprast YouTube ekosistēmas sarežģītību un savstarpējo saistību.

Tehnoloģiju sinerģija: mākslīgā intelekta un viedkoda spēks

Šī iespaidīgā projekta pamatā ir mūsdienu tehnoloģiju sinerģija. DAO, kura ikdiena paiet, strādājot kā izstrādātājam, izmantoja mākslīgā intelekta (MI) un viedkoda (angļu val. “vibe coding”) iespējas, lai atdzīvinātu šo karti. Process bija sadalīts vairākos loģiskos posmos. Pirmais un visietilpīgākais bija datu vākšana. Tas sagādāja pirmās nopietnās problēzes: YouTube API neatļauj tieši filtrēt kanālus pēc valsts, bet maksas resursi prasītu nesamērīgi lielas izmaksas. Vienīgais saprātīgais risinājums bija datu ieguve (parsing). Tas deva rezultātu: “Pekšņi, mums ir 10 000 kanālu. Un tie ir tikai kanāli ar vairāk nekā tūkstoš abonentu…” Tālāk sekoja nepieciešamība papildināt šos datus. Lai to paveiktu, DAO izstrādāja vēl vienu parsēšanas rīku, kas piekļuva katra YouTube kanāla lapai un savāca informāciju par astoņiem pēdējiem videoklipiem. Šādu pieeju varētu salīdzināt ar rūpīgu arheologu darbu, kur katrs atrasts artefakts palīdz atklāt senās civilizācijas noslēpumus.

Datu analīze un kategorizācija ar MI palīdzību

Kanālu tematisko grupu noteikšanai izstrādātājs izmantoja GPT API (versija 4o-mini), nosūtot tai kanālu nosaukumus un pēdējo videoklipu nosaukumus. MI modelis šo uzdevumu paveica ātri un efektīvi, process izmaksāja vien aptuveni vienu dolāru. Nākamais svarīgais posms bija “koordinātu” noteikšana – kartes struktūras izveide, kas paredz, kā kanāli tiks izvietoti. DAO izmantoja MI, lai pārvērstu kanālu un videoklipu nosaukumus vektoros. Tas nodrošināja, ka MI spēja precīzi orientēties informācijā. Tālāk tika izveidotas atsevišķas projekcijas, kas atspoguļoja kategoriju vektorus un videoklipu nosaukumu vektorus. Tika pielietots arī kombinētais režīms, lai nodrošinātu optimālu izvietojumu. Lai galu galā sakārtotu punktus kartē atsevišķās grupās, tika izmantots klasterizācijas algoritms, izmantojot Python bibliotēku HDBSCAN. GPT uzdevums bija arī nosaukumu piešķiršana šiem klasteriem, savukārt DAO pats izstrādāja skriptu, kas palīdzēja sadalīt “trokšņus” jeb atsevišķos punktus, kas atradās ārpus galvenajām grupām, atbilstošajās kategorijās. Šis process ir līdzīgs orķestra diriģentam, kurš harmonizē dažādus instrumentus, lai radītu skaistu melodiju.

Pieejamība un turpmākie uzlabojumi

Šobrīd interaktīvā karte ir brīvi pieejama ikvienam interesentam. Lai gan ir atzīts, ka tajā joprojām pastāv daži tehniskie “bugi”, izstrādātājs sola tos pakāpeniski novērst. Detalizētāka informācija par kartes izveides procesu ir pieejama speciālā video. Šis projekts ir ne tikai demonstrējums unikālām tehniskām prasmēm, bet arī vērtīgs resurss ikvienam, kas vēlas labāk izprast ukraiņu YouTube satura ainavu.