Etsi Internetistä videosta tai äänestä


Luentoselain antaa sinun etsiä avainsanoja luokkien ja konferenssien videoista Internetistä

Tämän Technology Review -artikkelin mukaan MIT: n tutkijat ovat kehittäneet ääni- ja videohakutyökalun, joka ratkaisee yhden keskeisimmistä ongelmista tällä alalla: kuinka jakaa suuri akateeminen luokka hallittavissa oleviin paloihin, tarkistaa avainsanan sijainti ja suoraan käyttäjiä kohti heitä. Tämä hakukone perustuu MIT: n ja muiden instituutioiden vuosikymmenien ajan suorittamaan äänentunnistustutkimukseen muuntaaksesi äänen tekstiksi ja mahdollistamaan hakuja siinä.

Luentoselain on syntynyt aikana, jolloin yhä useammat yliopistot lähettävät luokkien videoita ja podcasteja verkossa. Vaikka sen sisältö voi olla erittäin hyödyllinen, tietyn tiedon löytäminen luokista on monimutkaista ja joskus turhauttavaa oppilaille, jotka ovat tottuneet löytämään tarvitsemansa alle sekunnissa Googlen avulla.

"Se on yksi yliopistojen suurimmista ongelmista koko maassa", sanoo MIT: n tutkija Jim Glass. "On todellinen haaste tietää, kuinka levittää niitä ja helpottaa opiskelijoiden pääsyä luokan tiettyihin osiin, joista he voivat olla kiinnostuneita."

Luentoselaimen perustekijät ovat olleet olemassa jo yli 30 vuoden ajan MIT: n tutkimuslaboratorioissa ja muualla, kuten BBN Technologies, Carnegie Mellon, SRI International tai Etelä-Kalifornian yliopisto. Hänen aloitteidensa tuloksena on ollut ohjelmisto, joka on viime kädessä tarpeeksi hyvä ohjaamaan keskivertoa, sanoo BBN: n tutkija Premkumar Natarajan.

Muutama yritys, kuten verkkovideo- ja äänihakukoneet Blinkx ja EveryZing, käyttävät jo ohjelmistoa, joka muuntaa äänen haettavaksi tekstiksi, mutta MIT: n tutkijat kohtasivat joitain erityisiä ongelmia käyttäessään sitä luentoihin. akateeminen. Ensinnäkin, englanti ei ole monien puhujien äidinkieli, mikä vaikeuttaa automatisoituja transkriptiojärjestelmiä, jotka on koulutettu työskentelemään amerikkalaisten korostusmerkkien kanssa. Toisaalta tiedeluokissa vallitsevat sanat voivat usein olla vain vähän tunnettuja. Lopuksi, sanoo MIT: n tietotekniikan professori Regina Barzilay, luokilla on yleensä hyvin vähän havaittavissa olevaa rakennetta, mikä vaikeuttaa niiden sisällön jakamista ja järjestämistä haun helpottamiseksi.

Näiden ongelmien ratkaisemiseksi tutkijat perustavat ensin ohjelmiston, joka muuntaa äänen tekstiksi. He kouluttivat ohjelmiston ymmärtämään tiettyjä aksentteja käyttämällä tarkkoja tekstityksiä lyhyistä äänitteiden kappaleista. Auttaakseen ohjelmistoa tunnistamaan epätavallisia sanoja, tutkijat toimittivat sille lisätietoja, kuten kirjojen ja luentojen tekstiä, jotka auttavat ohjelmistoa oikein transkriboimaan neljä viidestä sanasta. Kuitenkin, jos järjestelmää käytetään sellaisen henkilön kanssa, jonka äidinkieli ei ole englanti ja jonka aksenttiä ja sanastoa järjestelmää ei ole opetettu, tarkkuus voi laskea 50%: iin (niin pieni tarkkuus ei olisi hyödyllinen transkriptio, mutta kyllä ​​avainsanahaulle).


Video: Top 10 Microsoft Edge Chromium Best Features


Edellinen Artikkeli

Kauris helmikuu 2013

Seuraava Artikkeli

Mariano Rajoyn horoskooppi: levoton ja optimistinen