Teknologi Speech Recognition, Cara Kerja dan Aplikasinya

0 20

Teknologi Speech Recognition

Speech recognition menjadi teknologi yang cukup revolusioner. Penggunaan teknologi speech recognition pada smartphone belakangan menjadi cukup booming. Dalam artikel ini akan dibahas mengenai pengertian, prinsip kerja serta contoh aplikasi teknologi speech recognition.

Pengertian Speech Recognition

Speech recognition adalah metode mengenali kata-kata yang terucap lewat suara manusia. Komputer dapat mendeteksi gelombang akustik yang dihasilkan oleh suara kita dan kemudian diterjemahkan menjadi teks. Speech recognition sangat berguna untuk membantu mengetik kata-kata.

Selain itu teknologi speech recognition juga dapat digunakan sebagai perintah suara. Dengan demikian komputer dapat mengerti perintah manusia yang diucapkan lewat suara. Hal ini yang membuat manusia dan komputer menjadi lebih interaktif.

Kelebihan speech recognition adalah pada kecepatan dan kemudahan untuk menggunakannya. Dengan speech recognition akan memudahkan kita untuk mengetik dokumen yang memiliki banyak kata-kata dengan sangat cepat. Kita tidak perlu lelah mengetik dengan keyboard, apalagi untuk orang yang tidak terbiasa mengetik.

Prinsip Kerja Teknologi Speech Recognition

Teknologi speech recognition merupakan teknologi biometrik. Teknologi biometrik adalah pengenalan terhadap identitas subjek. Komputer akan melakukan perbandingan antara hasil input suara dengan database kata-kata yang telah direkam sebelumnya. Setelah itu akan diverifikasi Apakah sudah sesuai dengan yang diucapkan.

Algoritma yang digunakan dalam teknologi speech recognition ini adalah algoritma FFT (Fast Fourier Transform). Algoritma ini merupakan cara yang efisien untuk memproses sinyal suara digital menjadi kata-kata.

Konsep utama algoritma ini dengan cara mengubah sinyal suara yang berbasis waktu menjadi sinyal berbasis frekuensi. Kemudian sinyal tersebut akan dicocokkan dengan pola pola yang sudah disimpan dalam database.

Skema dan Algoritma Speech Recognition

Sederhananya proses speech recognition pada komputer dibagi dalam empat langkah utama. Berikut adalah penjelasan masing-masing langkah tersebut.

  1. Pertama data input diterima melalui alat perekam suara berupa mic recorder yang terhubung dengan komputer.
  2. Setelah data input diterima data tersebut akan diekstraksi dan diubah menjadi bentuk frekuensi sekaligus pembuatan database untuk template.
  3. Tahap selanjutnya adalah perbandingan atau pencocokan input suara yang diterima dengan data suara yang telah tersimpan pada template
  4. Setelah melakukan perbandingan maka akan divalidasi antara input dan template yang tersedia. Validasi tersebut akan menghasilkan keputusan untuk menentukan kata apa yang diucapkan oleh pengguna.

Suara manusia dapat menghasilkan observable output yang diterjemahkan sebagai sebuah sinyal. Sinyal tersebut bisa berupa diskrit yang berupa karakter dalam alfabet. Sinyal juga bisa bersifat kontinyu seperti pengukuran temperatur dan alunan musik. Ada karakter sinyal yang bersifat stabil yang nilai statistik nya tidak berubah terhadap waktu. Adapula sinyal yang bersifat non stabil yang nilainya berubah-ubah terhadap waktu.

Dari Hal ini kemudian dilakukan simulasi dan pemodelan untuk memprediksi mengenali dan mengidentifikasi sinyal sinyal yang masuk melalui input. Secara umum model sinyal dapat dikelompokkan menjadi dua yaitu sebagai berikut.

  1. Model deterministik yang menggunakan nilai-nilai properti dari sebuah sinyal misalnya amplitudo frekuensi fase dari gelombang sinus.
  2. Model statistical yaitu menggunakan nilai nilai statistik dari sebuah sinyal seperti proses gaussian proses poisson proses Markov dan proses hidden Markov.

Perangkat yang Dibutuhkan Teknologi Speech Recognition

Untuk dapat menggunakan teknologi speech recognition secara maksimal maka setidaknya dalam sebuah perangkat  komputer terdapat beberapa komponen berikut ini

Microphone

Microphone merupakan perangkat yang berfungsi untuk merekam suara manusia yang nantinya akan diubah menjadi sinyal elektrik. Sinyal inilah yang diperlukan oleh komputer untuk diproses lebih lanjut.

Sound Card

Setelah melewati mikrofon gelombang suara ditangkap dan diproses oleh sound card untuk mengubah sinyal akustik menjadi elektrik. Sound card juga bertanggung jawab untuk memproses sinyal elektrik menjadi sinyal akustik yang akan dikeluarkan menjadi suara pada speaker.

Processor Komputer

Untuk menerjemahkan suara menjadi simbol membutuhkan perangkat komputer dengan software driver yang sesuai. Biasanya gelombang suara diterjemahkan menjadi suatu nomor biner yang dapat diidentifikasi dan dicocokkan dengan database yang berisi berkas suara yang telah dikenali.

Alat Output

Setelah berhasil mengidentifikasi suara, biasanya akan langsung diungkapkan melaui layar monitor atau diucapkan kembali oleh komputer lewat speaker. Dengan begitu komputer akan terasa sangat interaktif dengan suara manusia.

Aplikasi Teknologi Speech Recognition

Teknologi speech recognition sudah banyak disematkan pada perangkat pintar seperti komputer maupun smartphone. Pada tahun 2010 Microsoft melalui Windows Vista dan Windows 7 sudah mulai menyematkan fitur speech recognition dalam sistem operasinya. Mulai versi Windows Vista kita sudah dapat menggunakan perintah suara untuk mengoperasikan komputer.

Sementara yang populer saat ini adalah penggunaan teknologi speech recognition pada smartphone. Teknologi speech recognition digabungkan dengan teknologi artificial intelligence atau kecerdasan buatan untuk menciptakan asisten digital. Asisten digital tersebut diharapkan nantinya dapat berkomunikasi dan mengerti berbagai perintah dan Keinginan manusia.

Speech recognition pada perangkat

Apple Memulai Dengan asisten yang bernama Siri, Windows Phone mulai dengan Cortana sementara Android menggunakan Google Assistant dan Google Voice. Semua teknologi tersebut sebenarnya memiliki prinsip yang sama yaitu mengenali suara manusia dan mengidentifikasi maksud dari suara tersebut melalui algoritma yang telah diset sebagai template.

Selain itu teknologi speech recognition juga diterapkan pada bidang medis sebagai Electronic Medical Record (EMR). Diharapkan teknologi ini dapat membantu para penyandang disabilitas untuk melakukan berbagai hal hanya dengan memberikan perintah suara.

Itulah penjelasan detail mengenai pengertian, prinsip kerja serta contoh aplikasi teknologi speech recognition. Dengan membaca artikel ini diharapkan para pembaca tidak lagi bingung tentang teknologi speech recognition. Semoga bermanfaat dan dapat menambah wawasan pembaca.

Tuliskan Komentar