Nadchodzi AI audio

OpenAI w maju sfinalizował przejęcie start-upu sprzętowego Jony’ego Ive’a o nazwie io – transakcja, oparta wyłącznie na wymianie akcji, opiewała na kwotę około 6,4 mld dol. W jej wyniku do OpenAI dołączył nie tylko sam Ive, który przejął stery nad kreacją i designem, ale także zespół około 55 inżynierów. Wśród nich kluczową postacią jest Tang Tan, współzałożyciel firmy io, który w dokumentach sądowych jasno zaznaczył, że prototypy nie są ani słuchawkami, ani tradycyjną elektroniką noszoną na ciele (wearables).

Sprzęt to jednak tylko połowa sukcesu – sercem urządzenia ma być nowa generacja sztucznej inteligencji. Podobno OpenAI skonsolidowało swoje zespoły inżynieryjne, aby pracować nad zupełnie nową architekturą modelu audio – jego premiera zaplanowana jest na pierwszy kwartał 2026 r., co zgrywa się z planowanym debiutem pióra.

Obecne modele audio OpenAI wciąż borykają się z ograniczeniami – nie dorównują szybkością i precyzją modelom tekstowym. Firma zamierza jednak umożliwić bardziej naturalną mowę, błyskawiczne reakcje oraz – co kluczowe w płynnej konwersacji – obsługę przerywania wypowiedzi w czasie rzeczywistym. Za te kluczowe ulepszenia odpowiada Kundan Kumar, badacz zrekrutowany z konkurencyjnego Character.AI.

Gumdrop, wedle spekulacji, ma potencjał, by stać się „trzecim podstawowym urządzeniem” w życiu użytkownika elektroniki, komplementarnym wobec laptopa i smartfona. Ma być w pełni „świadome” otoczenia, dyskretne (mieszcząc się w kieszeni lub leżące na biurku) i gotowe do pracy w ułamku sekundy. Jeśli doniesienia się potwierdzą, 2026 r. może przynieść redefinicję tego, jak wchodzimy w interakcję ze sztuczną inteligencją – nie poprzez ekran, lecz za pomocą przedmiotu tak klasycznego, jak pióro.