
Többször felmerült már kommentekben, hogy a Telex miért nem csinál feliratot a legtöbb videójához, pedig biztos nagyot mennének külföldön. Mivel nagyon érdekelnek az AI területén elért előrelépések, úgy döntöttem, kipróbálom az OpenAI Whisper modelljére épülő whisper-ctranslate2 projektet, és a legújabb videójukhoz generáltam is angol és magyar feliratot:
[https://www.youtube.com/watch?v=yMUQuy3bRU0](https://www.youtube.com/watch?v=yMUQuy3bRU0)
Technikai részletek: kb 20-25 perc volt egy régebbi linuxos asztali gépen teljesen offline megcsinálni egy feliratot, meg az emberi munkaidő amíg telepítettem a csomagot, kipróbáltam pár beállítást (de pl. a beam-size-t nem) és javítottam a hibákat (időzítési problémák). A feliratokat kézzel nem javítottam (de megnéztem a videót hogy az időzítések tényleg stimmelnek).
A videót inkább csak amolyan demónak szánom, hogy itt tart most a technika egy csóró laikus kezében; semmiképpen sem állítom, hogy a Telexnek ebbe erőforrásokat kéne ölnie (elvégre megtehetné pl. a Google / YouTube is). Ha belenézel, úgyis világos lesz, hogy a fordítás továbbra sem egy könnyű vagy egzakt dolog, pláne, ha hibás mondatokat kell fordítanod (márpedig élőben mindenki mond zagyvaságokat).
OP, miért nem XY technológiát / szolgáltatást használtál, miért nem csináltad még ezt vagy azt, sokkal jobb lett volna? Mert nem értem rá, vagy nem tudtam róla, vagy fizetős, vagy próbáltam, de nem működött. Tisztában vagyok vele hogy vannak más feliratgeneráló projektek, hirtelen ezt sikerült működésre bírnom.
ui.: remélem a Telexnek nem probléma hogy kölcsönvettem a videójukat
3 comments
mindig érdekelnek mesterséges intelligenciás cikkek – én boomer vagyok, videót csak kényszer hatása alatt, nekem az olvasás az elsődleges információforrás, jobban megjegyzem mint a videót.
Google translate-et gyakran használom angolból német fordításra, elsősorban könyveket, ami aztán németül olvasok
ide tartozik a kérdés: hogyan tudnám egy könyv angol nyelvű borítóját valami AI-nek odaadni, hogy csináljon belőle német nyelvű címlapot? sok program hajlandó a képen lévő szöveget lefordítani, de ilyenkor rábasznak egy szürke csíkot az eredeti szövegre, és arra írják a német címet, ami nem szép, inkább meghagyom az angol címlapot.
Pedig simán meg tudná egy szoftver csinálni, hogy a betűket kitörli, az üres helyet a címlap többi részének megfelelően kiszínezi, majd rárakja az új, fordított címet. Na erre nem találok megoldást.
Pacsi ezért.
Volt egy csomó hangzó egyetemi anyagom, akkor ezzel fogom legépeltetni.
Nem is kell hozza sajat gep es linux… ingyenes google colabbal lehet whispert hasznalni. Nemreg magyaritottam/egyszerusitettem siket ismerosnek egy notebookot ami kikop egy magyar feliratot a magyar videokhoz. Bongeszobol mukodik gyenge irodai geprol is.
Sajat feliratot egy chrome addonnal be lehet tolteni.
Nem tokeletes, de messze jobb minden masnal amit probaltam. Forditast is tud, de az ki van kommentezve a vegen…
Masoljatok egeszseggel: https://colab.research.google.com/drive/1VS5Rh0gHlzNGSwN2GZ3Sk4Msmc5ITHxl?usp=sharing
Innen loptam: https://github.com/ArthurFDLR/whisper-youtube