Paweł Wimmer - blog towarzyszący kursowi języka HTML w Helionie. Założony 10 czerwca 2006.




darmowe liczniki - od 17.02.2008
Add to Google - zaabonuj RSS

Nowości Helionu


Blog > Komentarze do wpisu
Rozpoznawanie głosu w YouTube

Google dodał narzędzie, które znakomicie usprawni rozumienie obcojęzycznych klipów wideo. Jest to technologia ASR (Automatic Speech Recognition), ta sama, która służy Google Voice. Gdy uruchomisz klip w YouTube, możesz rozwinąć menu i wybrać polecenie Utwórz listę dialogową (transcribe audio). Google na bieżąco indeksuje anglojęzyczne klipy pojawiające się w YouTube (nie mam jednak pewności, na jaką skalę, a poza wszystkim zdarzają mu się błędy) i podsuwa na żądanie ścieżki. Co więcej, możesz nawet włączyć tłumaczenie.

Usiłowałem zmajstrować coś takiego w swoim klipie (wygłosiłem tam niedługi tekst ułomną angielszczyzną), ale napisów nie widać - być może klip czeka w kolejce, okaże się, albo po prostu Google nie rozumie mojego angielskiego. Natomiast w tym miejscu podsuwam zindeksowany już klip.

To na pewno jedno z najpoważniejszych tegorocznych dokonań technicznych w Internecie, które znacząco rozszerzy dostępność materiałów wideo.

piątek, 20 listopada 2009, prwimmer

TrackBack
TrackBack w tym blogu jest moderowany. TrackBack URL do wpisu:
Komentarze
2009/11/20 11:42:42
Racja - to milowy krok. Zrozumienie (obcojęzycznych) wypowiedzi zrozumieniem, ale przede wszystkim można już przeszukiwać i indeksować treści wideo.

Następne będzie sczytywanie napisów (np. plansze, podpisy, ścieżki dialogowe) które pojawiają się w klipach wideo. Myślę że to kwestia najbliższych tygodni ;)
-
2009/11/20 11:57:23
Nie widzę załączonego filmiku - czy jest to wina mojego firewalla, który to odsiewa, czy błąd przy załączaniu do notki?
-
2009/11/20 11:57:58
Mnie tylko ciekawi to, że o ASR zupełnie cicho. W polskiej blogosferze nic, w zagranicznej bardzo niewiele. Google także niezbyt to promuje, jak do tej pory.
-
2009/11/20 12:00:45
@hipek - o, dziwne! ja widzę i w Chrome, i w Firefoksie.
-
Gość: migawka, 87.204.10.1*
2009/11/20 12:51:33
a u mnie jest klip, ale nie pojawia się ścieżka dialogowa (Opera 9.64)
-
2009/11/20 15:59:27
@migawka Być może YT nie indeksuje jeszcze. Nie mam wiedzy, jak szeroki jest zakres indeksowania klipów.
-
2009/11/20 20:55:15
To mnie powaliło na kolana!!!

Skoro jest technologia, która tak ładnie rozpoznaje głos, to niedługo pojawi się w takich aplikacjach jak Skype ... mówisz po polsku, a twój rozmówca czyta po angielsku...
-
2009/11/20 22:17:19
Text-to-Speech było od dawna, na Speech-to-Text czekaliśmy bardzo długo. Jestem podekscytowany.
-
Gość: mariusz, 92.251.255.1*
2009/11/21 01:34:00
Na BBC wyświetlają napisy w programach na żywo. Występuje jedynie niewielkie opóznienie (max. kilka sekund). Jakość jest powalająca, tzn. nie widać żadnych błędów (czasami tylko pominą jakąś kwestię). Nie wiem jakiej technologi do tego używają, ale dziwię się że jeszcze tego nie przeniesiono do świata komputerów.
-
2009/11/21 14:16:55
No to muszę Googlowi podrzucić ten klip, ciekawe, jak sobie poradzi: my.opera.com/Jurgi/blog/2008/07/19/promien-smierci-metoda-domowa
;)
-
2009/11/21 14:27:24
Obejrzałem, wprawdzie jest sporo błędów, ale to i tak imponujące.
-
2009/11/22 12:31:29
@Jurgi - tak, czasem są zaskakujące błędy. Ale ludzie mówią często niechlujnie - i tak jest nieźle.
-
2009/11/22 22:25:08
wow oglądam dużo yputube a nwet tego nie znałem :)
-
Gość: migawka, 87.204.10.1*
2009/11/29 20:56:57
nie wiem jak to jest robione, ale ja nadal nie mam napisów do tego klipu
-
Gość: migawka, 87.204.10.1*
2010/03/18 17:04:21
@prwimmer a znasz jakieś oprogramowanie, które robi takie rzeczy speech-to-text (english)? mam kilka własnych klipów i chciałem sobie ścieżkę dialogową zrobić - zobaczyć jak to działa
-
2010/03/18 17:21:15
@Migawka Jest wbudowane podobno w angielskiego Worda. Osobnych programów nie znam, ale to już bardzo wysoka szkoła jazdy.