Indonesia Website Awards

Penelusuran Audio Google - Akankah Mungkin?

Penelusuran Audio Google - Akankah Mungkin?

Seotechman.com, Bogor 28/02/2021. Mungkinkah Google membuat Indeks Konten Audio yang dapat dicari pengguna untuk halaman web serupa?

Hasil pengujian awal, yang dipublikasikan Google dalam sebuah artikel blog, menunjukkan bahwa penelusuran audio lebih sulit dicapai daripada yang dapat terdengar.

Rincian pengujian ini dibagikan dalam artikel yang ditulis oleh Tim Olson, SVP of Strategic Digital Associations di KQED.

Google sedang dikaitkan dengan kqed dalam upaya bersama untuk membuat audio lebih indah.

Dengan bantuan kungfu.ai, penyedia layanan AI, Google dan KQED menjalankan tes untuk menentukan bagaimana mentranskripsikan audio dengan cara yang cepat dan tanpa kesalahan.

Inilah yang mereka temukan.

Kesulitan Pencarian Audio.

Hambatan terbesar dalam melakukan pencarian/penelusuran audio adalah kemungkinan audio harus menjadi teks sebelum dapat dicari dan disortir.

Saat ini tidak ada cara untuk mentranskripsikan dengan presisi audio dengan cara yang memungkinkan Anda melakukannya dengan cepat.

Satu-satunya cara untuk memungkinkan penelusuran audio dalam skala dunia adalah melalui transkrip otomatis. Transkrip manual membutuhkan banyak waktu dan tenaga dari penerbit.

KQED olson menunjukkan bagaimana bilah presisi harus tinggi untuk transkrip audio, terutama dalam hal pengindeksan berita audio. Kemajuan yang dibuat sejauh ini dalam pidato teks saat ini tidak memenuhi standar tersebut.

Keterbatasan Teknologi Ucapan Saat Ini.

Google melakukan pengujian dengan KQED dan KungFu.ai melalui aplikasi alat ucapan ke teks terbaru ke kumpulan berita audio.

Keterbatasan dalam kapasitas AI ditemukan untuk mengidentifikasi substansi yang sesuai (juga dikenal sebagai entitas yang ditunjuk).

Entitas yang disebutkan terkadang perlu memahami konteks untuk diidentifikasi secara akurat, yang tidak selalu dimiliki AI.

Olson memberikan contoh berita audio kqed yang berisi pidato penuh entitas yang ditunjuk yang kontekstual dengan Bay Area Region:

"Audio berita lokal KQED kaya akan referensi entitas yang ditunjuk terkait dengan topik, orang, tempat, dan organisasi yang kontekstual dengan wilayah Bay Area. Pembicara menggunakan akronim sebagai" ChP "untuk patroli jalan raya California dan" La Peninsula "untuk wilayah yang mencakup San Francisco hingga San José. Ini lebih sulit untuk mengidentifikasi kecerdasan buatan."

Ketika entitas yang ditunjuk tidak dipahami, AI membuat dugaan terbaik tentang apa yang dikatakan. Namun, itu adalah solusi yang tidak dapat diterima untuk penelusuran web, karena transkripsi yang salah dapat mengubah semua arti dari apa yang dikatakan.

Apa yang Harus Dilakukan Berikutnya?

Pekerjaan pencarian audio akan dilanjutkan dengan rencana agar teknologi dapat diakses secara luas saat dikembangkan.

David Stoller, Pemimpin Mitra untuk Berita & Penerbitan di Google, mengatakan teknologi akan dibagikan secara terbuka ketika pengerjaan proyek ini selesai:

"Salah satu pilar dari inisiatif baru Google adalah memasukkan pendekatan baru untuk masalah yang sulit. Setelah selesai, teknologi ini dan praktik terbaik terkait akan dibagikan secara terbuka, sehingga sangat memperluas dampak yang diantisipasi."

Model pembelajaran mesin saat ini tidak belajar dari kesalahan mereka, kata Olson de Kqed, di mana manusia mungkin harus campur tangan.

Langkah selanjutnya adalah mencoba putaran umpan balik di mana redaksi berita membantu meningkatkan model pembelajaran mesin dengan mengidentifikasi kesalahan transkripsi yang umum.

"Kami yakin bahwa dalam waktu dekat, peningkatan model berbicara teks ini akan membantu mengubah audio ke teks lebih cepat, yang pada akhirnya akan membantu orang menemukan berita audio dengan lebih efektif."

[SOURCE]: Google