Nagara Of Linux Ubuntu Sora Pangakuan

perkenalan

Kuring méakkeun loba waktos nalungtik pikeun artikel na rada mindeng Jigana ngeunaan materi palajaran pikeun hiji artikel whilst leumpang ka stasiun karéta atawa nalika kaluar na tentang sacara umum.

Hiji sore whilst leumpang 1,5 mil ka stasiun ti pagawean abdi Teu sangka "teu bakal dinya jadi alus lamun kuring bisa ngarekam naon kuring hayang ngomong lajeng gaduh eta ditranskripsi otomatis ka file téks nu kuring bisa ngédit sarta format engké dina" .

Kuring geus spent loba jam lila pilari di pilihan béda sadia pikeun pangakuan sora na dikte kaasup ngarekam langsung ngaliwatan mikropon hiji maké software dikte di Linux, ngarékam éta file pikeun MP3 atanapi format WAV sarta ngarobah éta liwat garis paréntah, kitu ogé maké Chrome jeung aplikasi Android.

Artikel ieu highlights papanggihan kuring sanggeus poé buruh teuas.

Pilihan Linux Ubuntu

Nyobian pikeun manggihan dikte jeung software pangakuan sora dina Linux Ubuntu henteu sakumaha gampang saperti eta bisa jadi jeung pilihan sadia henteu yen palinter.

Kaca wikipedia ieu daptar pilihan poténsi kaasup CMU Sphinx, Julius jeung Simon.

Kuring keur ngagunakeun SparkyLinux nu dumasar kana Debian Tés dina momen na abdi tiasa ngabejaan Anjeun yen hiji-hijina sora pakét pangakuan sadia di repositories nyaéta Sphinx.

The program Linux Ubuntu pituin kuring réngsé nepi nyobian nya PocketSphinx, nu kuring dipaké pikeun ngarobah payil WAV kana téks na Freespeech-VR nu mangrupakeun aplikasi python nu ngidinan Anjeun ngarekam lempeng tina mikropon hiji.

Kuring ogé diusahakeun sababaraha aktip Chrome kaasup VoiceNote II na Dictanote.

Tungtungna kuring diusahakeun teh "dikte sarta surélék" jeung "Talk Jeung Talk dikte" Android Aplikasi.

Freespeech-VR

Freespeech-VR teu sadia di repositories baku. Kuring diundeur payil ti dieu.

Saatos ngundeur tur extracting eusi file pos I BUBUKA terminal sarta navigated kana folder mana payil anu sasari mun.

Kuring diketik paréntah di handap pikeun muka freespeech-vr.

sudo python freespeech-vr

Kuring boga sapasang headphone ku mikropon anu cukup santun sarta aksen Inggris cukup jelas kidul.

Téks di handap mucunghul dina jandela freespeech-vr:

Wilujeng sumping di anjing unit hasilna Dinten Kagungan mastikeun Kumaha mun Diurus Tés Hiji kudu nguji Nalika Pikeun téks Mangpaat Biantara sistem jalan kuring teh Ka hiji tiap éta Ngan Dina hiji Pikeun mudahan tina tinggal Sareng Karakter keur Maksadna tina Hiji hayam emas salaku sistem The EA lamun eta ngaran abdi di gigireun ofch nyaéta panggero telepon file ieu cukup moal lami deui hiji telepon kasus ka Hands- Spasi Sphinx teh bade éta henteu a telepon bakal dibagikeun a dilatih sarta sarta parabot ngagunakeun diomongkeun lamun anjeun rengse Ucapkeun a dipaké file a Tukang carita a jeung maké ku Nalika eta pisan kumaha sukses Linux Ubuntu ieu salaku Naha anjeun ulah anu

Kuring ngan hoyong ngomong ayeuna nu ieu teu nu Unit Of ramatloka Anjing na di euweuh titik tuh kuring nyebut nanaon ka teu jeung Golden hayam. Kuring ieu sabenerna nyoba ngajelaskeun prosés migunakeun software pangakuan sora.

Kuring diusahakeun software nu sababaraha kali kaasup varying pitch jeung speed tapi akurasi ieu goréng.

PocketSphinx

PocketSphinx téh bisa nyandak file WAV sarta ngarobah ka téks ngagunakeun jalur komando.

PocketSphinx nyaéta sadia via repositories Debian na kedah disadiakeun pikeun paling sebaran.

Isu utama kuring kapanggih jeung PocketSphinx nyaeta nu ampir perlu gelar dina konsep pangakuan sora, file basa, kamus tur kumaha carana ngalatih sistem.

Sanggeus masang PocketSphinx anjeun kudu indit ka ramatloka CMU Sphinx jeung maca salaku loba informasi-gancang. Anjeun oge kudu ngundeur file model di handap.

(Mun anjeun lain spiker pituin basa Inggris milih model basa nu geus luyu pikeun anjeun).

Dokuméntasi pikeun PocketSphinx sarta Sphinx di umum hese ngarti pikeun jalma lay tapi tina naon anu bisa kuring sangkan kaluar file kamus nu dipaké pikeun nyadiakeun daptar kecap mungkin jeung model basa boga daptar ngucapkeun poténsial.

Pikeun nguji PocketSphinx I dipaké rékaman tina sora kuring sorangan, nu snippet tina Al Pacino dina "The Devils ngajengkeun" sarta snippet tina "Morgan Freeman". Titik ieu nyobian voices béda jeung kuring aya taya sahijieun anu bisa ngabejaan carita salaku jelas sakumaha Morgan Freeman tur taya sahijieun delivers hiji garis kawas Al Pacino.

Pikeun PocketSphinx digawekeun eta perlu file WAV sarta eta perlu jadi dina format nu tangtu. Lamun file dina format MP3 nganggo paréntah ffmpeg pikeun ngarobah kana format WAV:

ffmpeg -i inputfilename.mp3 -acodec pcm_s16le -ar 16000 outputfilename.wav

Pikeun ngajalankeun PocketSphinx nganggo paréntah di handap:

pocketsphinx_continuous -dict /usr/share/pocketsphinx/model/lm/en_US/cmu07a.dic -infile voice2.wav -lm cmusphinx-5.0-en-us.lm 2> voice2.log

pocketsphinx_continuous nyokot berkas WAV jeung ngarobahna kana téks.

Dina paréntah luhur pocketsphinx geus bébéja ka ngagunakeun file kamus disebut "/usr/share/pocketsphinx/model/lm/en_US/cmu07a.dic" kalawan modél basa "cmusphinx-5.0-en-us.lm". file nu keur dirobah jadi téks disebutna voice2.wav (anu mangrupakeun rekaman mah dijieun kalawan sora kuring). Tungtungna éta 2> tempat sagala kaluaran verbose nu teu merta butuh kana file disebut voice2.log. Hasilna saleresna tes dipintonkeun dina jandela terminal.

Hasil maké sora abdi téh saperti kieu:

ngabagéakeun ka hareup ngeunaan ogé henteu tunduk minggu ieu ngeunaan nu pangakuan software dina menit a

Hasilna teu jadi horrendous sakumaha kalayan freespeech-vr tapi tetep teu bener useable. Kuring lajeng diusahakeun make PocketSphinx kalayan Al Pacino tapi ieu balik euweuh hasilna pisan.

Tungtungna kuring diusahakeun make sora Morgan Freeman urang ti pilem "Bruce Nu Maha Kawasa" na didieu aya hasilna:

000000000: urang gé dina dirina
000000001: aya sagala rupa nu tangguh hehehehe dinten nu ayeuna hehehehe ieu paling urang geus hirup abdi bagian ku panas
000000002: dina lift nu Éta konci nu kaluar tina saeutik pukul baseball atawa tahu naon nu kudu jeung dina kahirupan
000000003: naon nu leuwih anu bakal cageur
000000004: maranéhna teu nulis deui
000000005: dipibanda on kuring katuhu kaluar
000000006: anjeun kudu jadi aturan
000000007: abdi geus expecting Anjeun
000000008: na anjeunna diajar di dieu anu hiji ilustrasi ieu ieu killer pihak natal
000000009: tétéla salah sahiji cara nulis o. Ass i panginten sababaraha salawasna ngagem salah sahiji
000000010: kawas nu masalah ngahiji moal masihan anjeunna nu alus Kuring estimasi aranjeunna dina momen anu lamun urang teu sakabeh nu pikir abdi di dunya bakal imah na i geus katempo yen
000000011: bapa anu boga eta
000000012: keur naon gelar loba ngeunaan ieu
000000013: henteu anu dibikeun
000000014: sagalana anjeun jalma nu moal tumiba pikeun pisan
000000015: katuhu dina gugur
000000016: ogé tahan ngan keur kuring
000000017: hiji bagja lamun abdi pikir teuing nu aranjeunna nuju akang gaduh hiji yén éta sakabéh nu nikah dina baris no kami ngalakukeun abdi resep ka kawas jalan

test abdi tiasa boro dianggap ilmiah sarta pamekar ti PocketSphinx bisa nangtang yen Kuring keur teu make software nu neuleu. Aya ogé latihan sora téhnik disebut nu bisa dipaké pikeun nyieun kamus hadé jeung payel basa.

pendapat overriding kuring sanajan téh nya éta ngan teuing hésé pikeun pamakéan sapopoé baku.

VoiceNote II

VoiceNote II mangrupakeun App Chrome nu ngagunakeun API Google pangakuan sora.

Mun anjeun ngagunakeun panyungsi Chrome atanapi Chromium anjeun tiasa install VoiceNote II via Store Web .

Ikon on VoiceNote II anu diteundeun kaluar dina fashion aneh anjeun kudu nyetél basa di handap jandela jeung tombol édit oge di handap, kumaha tombol catetan anu dina posisi katuhu luhur.

Hal kahiji kudu maneh mun geus milih hiji basa tur ieu bisa dihontal ku ngaklik dina ikon dunya.

Pikeun ngawitan ngarékam, klik dina ikon mikropon tur mimitian diomongkeun kana mikropon Anjeun. Pikeun hasil pangalusna I kapanggih diomongkeun lalaunan éta konci supaya software nu bakal boga kasempetan pikeun tetep nepi.

Hasil éta teu hébat sakumaha bisa ditempo di handap ieu:

Hello sarta ngabagéakeun nyambung. About.com todays artikel ngeunaan sora keur konversi téks dunelm Farrell resesi 2008 salaku conversions na eta ceuk ogé dirojong kalawan cara anu pangalusna i kapanggih addon téks sora pikeun némbongkeun 2014debian atanapi rpm pakét buka eta tipe sora kana ucapan jeung tulisan buka eta upami Anjeun hoyong pilih vs milih di Edinburgh Perancis Jerman meunang maneh the time dina ngahiji kingdomstart di laut microphonewhat Anjeun rengse nulis téks anjeun salaku file téks pikeun itsuccess ogé éta pisan standar aksen english ti kidul Inggris pangalusna pikeun eta tapi abdi Kaula bade ka textvia torrentalong ieu jeung dokumen sabenerna tur anjeun tiasa ningali keur kasalahan anu makethank nuhun listeningfriends

Dictanote

Dictanote nyaeta App Chrome sejen anu bisa dipaké pikeun tujuan dikte jeung datang di sakuliah salaku mahluk anu leuwih intuitif tapi hasil éta teu sagala hadé ti VoiceNote II.

Kuring ukur dipaké versi demo ngeunaan Dictanote nu nyegah anjeun ti nyieun dokumen anyar tapi ngidinan Anjeun ngobrol leuwih téks nu geus di sanésna. Kuring éta bisa nguji pangakuan sora tapi hasil no hade tinimbang VoiceNote II tur jadi kuring henteu ngadaptarkeun versi pro.

Dikte Jeung Surat

"Dikte Jeung Surat" mangrupa Aplikasi Android anu ngagunakeun pituin Google pangakuan sora API.

Hasil tina "dikte sarta Surat" éta leuwih hadé ti salah sahiji program séjén ngusahakeun nepi ka titik ieu.

pantun wilujeng sumping ka Linux Ubuntu ngeunaan., dinten urang ngawangkong ngeunaan jalan ngarobah sora ka téks

The trik jeung "dikte sarta Surat" nyaeta mun nyarita lalaunan jeung pronunciate sakumaha ogé nu bisa kalawan malah aksen.

Saanggeus beres ngobrol bisa surélék hasil ka diri.

Ngobrol Jeung Talk dikte

The Aplikasi Android séjénna yén kuring diusahakeun éta "Talk Jeung Talk dikte".

Antarbeungeut pikeun aplikasi ieu anu pangalusna kebat jeung pangakuan sora digawé kacida alusna memang. Saatos ngarekam dikte nu ieu bisa babagi hasil dina sagala rupa cara kaasup via email.

ngabagéakeun ka Linux Ubuntu about.com kiwari urang nuju ngawangkong ngeunaan jalan ngarobah ucapan kana téks

Sakumaha anjeun tiasa tingali tulisan di luhur nyaeta ngeunaan sakumaha jelas anjeun kamungkinan bisa ngaharepkeun pikeun meunang. Ngawangkong lalaunan nya kenop.

singgetan

Asalna Linux Ubuntu boga sababaraha cara pikeun buka kalayan Wasalam ka sora pangakuan sarta husus dikte. Aya sababaraha aplikasi nu nganggo API Google sora tapi maranéhna teu acan kadaptar di repositories.

aplikasi ChromeOS téh saeutik saeutik hadé tapi ku tebih hasil pangalusna anu kahontal ngagunakeun telepon Android abdi. Meureun telepon ngabogaan mikropon hadé tur kituna teh software pangakuan sora nangtung kasempetan hadé konvérsi.

Pikeun pangakuan sora jadi bener usable eta perlu jadi leuwih intuitif jeung setelan kirang diperlukeun. Anjeun teu kudu perlu mess sabudeureun kalayan model basa jeung kamus guna nyieun intelligible.

kumaha oge I ngahargaan yen sakabeh seni pangakuan sora pisan nangtang sabab everybody ngabogaan sora béda jeung aya kitu loba dialek ti wewengkon ka wewengkon dina hiji nagara nanaon pikahariwangeun ngeunaan ratusan basa dipaké di sakuliah dunya.

analisa abdi, ku kituna, aya nu software pangakuan sora ieu masih dianggo di kamajuan.