Kumaha Paké 'Ngram Viewer' Alat di Google Buku

A Ngram, ogé biasa disebut hiji Ngram nyaéta analisa statistik tina téks atanapi ucapan eusi pikeun manggihan n (jumlah) tina sababaraha nurun item dina téks. Bisa jadi sagala sorts hal, kawas fonem, émbohan, frasa, atawa hurup. Sanajan N-gram téh rada teu jelas luar tina panalungtik, éta sabenerna dipaké dina rupa-rupa widang, sarta eta boga loba implikasi keur urang nyieun program komputer nu ngartos na ngabales ku basa lisan alam. Yen, dina nutshell hiji, bakal jadi dipikaresep Google di ide.

Dina kasus Google Buku Ngram Viewer, teks bisa dianalisis asalna tina jumlah vast buku Google geus discan di ti perpustakaan publik keur populate maranéhna Google Buku search engine. Pikeun Google Buku Ngram Viewer, aranjeunna tingal téks Anjeun bade milarian salaku "korpus". The kopral dina Ngram Viewer dibagi up ku basa, sanajan anjeun nyalira tiasa nganalisis Britania jeung Amérika Inggris atanapi lump aranjeunna duaan. Ieu ends nepi kabawa super metot kana toggle ti Britania pikeun pamakéan Amérika istilah na ningali robah grafik.

Kumaha Ngram Works

  1. Buka Google Buku Ngram Viewer di books.google.com/ngrams.
  2. Item nu hal-sénsitip, kawas maluruh Web Google, jadi pastikeun capitalize nomina ditangtoskeun.
  3. Ketik dina sagala frase atawa frasa hayang cara analisa. Pastikeun pikeun misahkeun unggal frase kalawan koma. Google nunjukkeun "Albert Einstein, Sherlock Holmes, Frankenstein" pikeun meunang nu dimimitian.
  4. Salajengna, tipe dina rentang titimangsa. standar nyaeta 1800 nepi 2000, tapi aya buku leuwih panganyarna (2011 éta paling panganyarna didaptarkeun dina dokuméntasi Google, tapi nu mungkin geus robah.)
  5. Milih korpus a. Anjeun tiasa milarian naskah basa deungeun atawa basa Inggris, sarta sajaba pilihan standar, Anjeun bisa mere nyaho hal kawas "English (2009) atawa Amérika Inggris (2009)" di handap. Di handap ieu mangrupakeun corpora heubeul nu Google geus saprak diropéa, tapi anjeun bisa jadi kudu sababaraha alesan sangkan babandinganana anjeun ngalawan susunan data heubeul. Paling pamaké bisa malire aranjeunna sarta fokus dina corpora panganyarna.
  6. Atur tingkat smoothing Anjeun. Smoothing nujul kana kumaha lemes grafik nyaéta dina tungtungna. The ngagambarkeun paling akurat bakal janten tingkat smoothing 0, tapi nu meureun hésé maca. standar nu disetel ka 3. Dina kalolobaan kasus, Anjeun teu kedah diluyukeun ieu.
  1. Pencét kavling Search sahiji tombol buku. (Anjeun tiasa ogé ngan pencét énter di ajakan pilarian.)

Naon Dupi Ngram némbongkeun?

Google Buku Ngram Viewer bakal kaluaran grafik anu ngagambarkeun pamakéan frase hususna dina buku liwat waktu. Lamun geus diasupkeun leuwih ti hiji kecap atawa frasa, anjeun bakal nempo garis warna-disandi kana kontras istilah pilarian béda. Ieu geulis sarupa Google Tren , ukur néangan nyertakeun periode panjang waktu.

Di dieu hiji real-hirup example.We éta panasaran ngeunaan pies cuka anyar. Aranjeunna nuju disebutkeun dina Laura Ingalls Wilder urang Little House dina runtuyan tegal, tapi urang pernah kukituna ngadéngé hal saperti a. Urang munggaran dipaké pilarian Web Google pikeun leuwih jéntré ngeunaan pies cuka. Tétéla, aranjeunna nuju diangap asakan Southern Amérika sarta bener anu dijieun tina cuka. Aranjeunna hearken deui kali nalika teu sadaya jelema kedah aksés ka ngahasilkeun seger sepanjang waktos taun. Éta sakabéhna carita?

Urang searched Google Ngram Viewer, sarta aya sababaraha nyebutkeun ngeunaan pai dina duanana nu 1800s mimiti na telat, loba nyebutkeun dina 1940s, sarta hiji angka beuki nyebutkeun di kali panganyarna (sugan sababaraha pai nostalgia.) Muhun, aya sababaraha masalah jeung data dina tingkat smoothing of 3. Aya dataran hiji leuwih nyebutkeun dina 1800s. Pasti aya teu hiji angka sarua nyebutkeun hiji pai tinangtu tiap taun keur lima taun? Aya naon dina éta kusabab aya teu loba buku diterbitkeun dina mangsa éta, sarta kusabab data kami disetel ka halus, éta ngaruksak gambar. Meureun aya hiji buku anu disebut di luhur cuka pai, sarta eta ngan meunang averaged ulah spike a. Ku netepkeun smoothing ka 0, urang bisa nempo yén ieu téh kahayang kasus nu bener. spike puseur dina 1869, sarta aya spike sejen di 1897 jeung 1900.

Naha taya sahijieun ngobrol ngeunaan pies cuka sesa waktu? Éta meureun tuh ngobrol ngeunaan eta pies. Aya kamungkinan resep floating sakuliah tempat. Éta ngan teu nulis ngeunaan aranjeunna dina buku, tur éta hiji watesan tina maluruh Ngram ieu.

Canggih Ngram maluruh

Inget kumaha urang ngomong yén Ngrams bisa diwangun ku sagala sorts maluruh téks béda? Google ngidinan Anjeun pikeun bor handap rada saeutik jeung Ngram Viewer ogé. Lamun remen milari lauk verba gaganti lauk nomina, Anjeun tiasa ngalakukeun kitu ku cara make tag. Dina hal ieu, Anjeun kukituna milari "fish_VERB"

Google nyadiakeun nafsirkeun Paréntah anjeun bisa make jeung dokuméntasi canggih lianna dina ramatloka maranéhanana.