Selasa, 09 November 2010

spech syntesis

Speech Syntesis adalah proses di mana komunikasi verbal yang direplikasikan melalui perangkat buatan. Sebuah komputer yang mengkonversi text to speech merupakan salah satu jenis synthesizer pidato. Bentuk paling awal Speech Synthesis dilaksanakan melalui mesin yang dirancang untuk berfungsi seperti saluran suara manusia. Mesin berbicara diciptakan oleh Wolfgang von Kempelen pada tahun 1700-an. Dengan perangkat ini, speech(pidato) dihasilkan melalui dapur bawah, buluh bagpipe dan bel klarinet. Dapur bawah ini dirancang untuk bertindak seperti paru-paru, sedangkan glotis (daerah pita suara) diwakili melalui bagpipe (buluh). Bel klarinet menjabat sebagai mulut.
Pengoperasian perangkat benar-benar manual. Tangan kanan dikontrol serangkaian tuas sementara tangan kiri dimanipulasi bel klarinet (mulut). Ada juga pilihan memasukkan 'lubang hidung', untuk menghasilkan suara hidung. Selama kontrol dasar digunakan, mesin menerima aliran udara. aliran udara ini menentukan jenis suara yang akan dihasilkan.
Pada akhir 1800, Joseph Faber menciptakan sebuah mesin berbicara yang dapat menerima input melalui keyboard dan pedal. Mesin juga sangat kreatif. Ketika abad ke-20 tiba, inovasi dalam Speech Synthesis elektronik diperbolehkan untuk mengambil sisi yang berbeda. Walaupun premis meniru alat suara manusia masih sama, mesin awal abad ke-20 bisa menghasilkan suara yang lebih baik karena input lebih tepat. Namun, tidak sampai munculnya komputer yang ber speech synthesis bisa dipakai untuk di luar arena hiburan. Hal ini terutama karena pidato synthesizer dapat disimpan dalam perangkat lunak, bukan mesin yang terpisah. Selain itu, dengan komputer sebagai alat bantu, speech synthesis bisa mengambil bentuk yang berbeda menggunakan suara manusia sebagai sumber utama untuk suara.
Speech synthesis dikenal sebagai concatenative. Proses ini bekerja dengan menghubungkan berbagai rekaman suara manusia. Suara yang dihasilkan jauh lebih alami dan lebih enak didengar oleh telinga. Hal ini berbeda dengan program yang menggunakan sintesis artikulatoris, di mana bicara direplikasi melalui model komputerisasi pada saluran vokal.
speech synthesizer Komersial dapat menggunakan metode concatenative atau artikulatoris, namun keduanya dapat mencapai tujuan yang sama yaitu mampu memberikan orang kesempatan untuk mendengar teks. Hal ini sangat berguna dalam situasi di mana membaca tidak mungkin. Dalam dunia bisnis, situasi tersebut sangat umum, terutama untuk transaksi telepon. Tanpa teks-to-speech (TTS) alternatif, pemilik bisnis harus mengeluarkan uang untuk mempekerjakan tenaga layanan pelanggan bahkan lebih. solusi sintesis menghindari masalah ini, karena semuanya dilakukan oleh komputer, bukan manusia.
speech synthesis juga memainkan peran dalam kehidupan sehari-hari, terutama untuk orang yang tunarungu, kamus dan perangkat lain dapat membuat hal-hal mudah bagi orang yang memiliki kesulitan untuk melihat atau membaca.
Speech Synthesis bahkan dapat memberikan suara pada individu yang tidak dapat berbicara sama sekali. Steven Hawking, seorang ahli fisika terkenal, adalah contohnya. Sejak penyakit Lou Gehrig telah menjadikan dia bisu, Hawking menggunakan synthesizer suara untuk berkomunikasi dengan orang. Ada juga aplikasi TTS yang tersedia untuk membantu membantu orang-orang dengan berbagai kegiatan komputer. Untuk mendapatkan jenis aplikasi, kebanyakan pengguna akan harus membeli perangkat lunak terpisah atau patch download. Opsi yang terakhir ini biasanya gratis, tergantung pada sistem operasi atau program pengolah kata yang digunakan. Namun, jika seseorang memutuskan untuk membeli perangkat lunak terpisah, mereka bisa memiliki akses ke sistem yang lebih tinggi berkualitas. Contoh-contoh spesifik dapat dilihat melalui Alam Reader 7 dan Teks Aloud 2.



referensi :

http://www.wisegeek.com/what-is-speech-synthesis.htm
Speech Recognation


Speech Recognation adalah suatu sistem mengidentifikasi seseorang dari suaranya. Voice Recognition/Verivication mengidentifikasi siapa yang berbicara, sedangkan Speech Recognition karena mengidentifikasi apa yang diucapkannya.
Hardware yang dibutuhkan adalah :

1. SoundCard, merupakan alat yang ditambahkan dalam suatu Komputer yang fungsinya sebagai input dan output suara untuk mengubah sinyal elektrik, menjadi analog maupun menjadi digital.
2. Microphone, Alat untuk mengubah suara yang melewati udara, air dari benda orang menjadi sinyal elektrik.
3. Processor/Komputer, Dalam proses suara digital menterjemahkan gelombang suara menjadi suatu simbol biasanya menjadi suatu nomor biner yang dapat diproses lagi. Saat pengunaan menggunakan mikrofon, soundcard berkualitas baik, sehingga akan mengurangi noise yang disebabkan karena terganggu sinyal monitor, pci slots.
4. Software pendukung Speech dan Voice Recognition, misal yang bersifat Freeware



Cara Kerja:

Speaker recognition menggunakan fitur akustik ucapan yang ditemukan berbeda pada setiap orang. Ciri akustik tersebut disebabkan adanya perbedaan anatomi (seperti bentuk mulut dan tenggorokan) dan kebiasaan yang berbeda seperti (penekanan dan gaya bahasa). Perbedaan yang khas tersebut disebut “voiceprints“ yang menjadi suatu metode biometric.
Skema Utama Speech Recognition, terdapat 4 langkah utama dalam sistem pengenalan suara :

1. Penerimaan data input.
2. Ekstraksi, yaitu penyimpanan data masukan sekaligus pembuatan database untuk template.
3. Pembandingan/pencocokan, yaitu tahap pencocokan data baru dengan data suara (pencocokan tata bahasa) pada template.
4. Validasi identitas pengguna.

Secara umum, speech recognizer memproses sinyal suara yang masuk dan menyimpannya dalam bentuk digital. Hasil proses digitalisasi tersebut kemudian dikonversi dalam bentuk spektrum suara yang akan dianalisa dengan membandingkan dengan template suara pada database sistem. Sebelumnya, data suara masukan dipilah-pilah dan diproses satu per satu berdasarkan urutannya. Pemilahan ini dilakukan agar proses analisis dapat dilakukan secara paralel.

Speech recognition merupakan salah satu jenis biometric recognition,yaitu proses komputer mengenali apa yang diucapkan seseorang berdasarkan intonasi suara yang dikonversi ke dalam bentuk digital print.

Pengenalan pola suara adalah salah satu aplikasi yang berkembang saat ini. Sistem ini mengijinkan kita untuk berkomunikasi antara manusia dengan memasukkan data ke komputer. Salah satu fungsinya adalah untuk meningkatkan efisiensi industri manufaktur, mengontrol mesin dengan berbicara pada mesin itu. Algoritma yang diimplementasikan untuk masalah pengenalan suara ini adalah algoritma divide and conquer. Proses awalnya adalah mengkonversi data spektrum suara ke dalam bentuk digital dan mengubah dalam bentuk diskrit.



sumber :
http://en.wikipedia.org/wiki/Speech_recognition

http://triyadi.com/kecerdasan-buatan-artificial-intelegence/23-speech-recognition.html

http://cslu.cse.ogi.edu/HLTsurvey/ch1node4.html

http://www.sani4president.co.cc/2008/12/summary-of-apacheorg.html

Browsing Audio Data

Browsing Audio Data merupakan metode browsing jaringan yang digunakan untuk browsing video / audio data yang ditangkap oleh sebuah IP kamera. Jaringan video / audio metode browsing mencakupi langkah-langkah sebagai berikut :

* Menjalankan sebuah program aplikasi komputer lokal untuk mendapatkan kode identifikasi yang disimpan dalam kamera IP
* Transmisi untuk mendaftarkan kode identifikasi ke DDNS ( Dynamic Domain Name Server) oleh program aplikasi
* Mendapatkan kamera IP pribadi alamat dan alamat server pribadi sehingga pasangan IP kamera dan kontrol kamera IP melalui kamera IP pribadi alamat dan alamat server pribadi
* compile ke layanan server melalui alamat server pribadi sehingga untuk mendapatkan video / audio data yang ditangkap oleh kamera IP, dimana server layanan menangkap video / audio data melalui Internet.

sumber :

http://montik-brownies.web.id/sartika/?p=73

www://wikipedia.org

Tangible User Interface

Sebuah user interface yang nyata (TUI) adalah sebuah antarmuka pengguna di mana seseorang berinteraksi dengan informasi digital melalui lingkungan fisik. Nama awal Graspable User Interface, yang tidak lagi digunakan.

Salah satu pionir dalam user interface yang nyata adalah Hiroshi Ishii, seorang profesor di MIT Media Laboratory yang mengepalai Media Group Berwujud. visi tertentu Nya bagi UIS nyata, yang disebut Bits Tangible, adalah memberikan bentuk fisik ke informasi digital, membuat bit secara langsung dimanipulasi dan mencolok. bit Berwujud mengejar kopling mulus antara dua dunia yang sangat berbeda dari bit dan atom.

Karakteristik Tangible User Interface

1. representasi fisik adalah komputasi digabungkan dengan informasi digital yang mendasari.
2. representasi fisik mewujudkan mekanisme kontrol interaktif.
3. representasi fisik adalah perseptual digabungkan dengan representasi digital secara aktif dimediasi.
4. keadaan fisik tangibles mencakup aspek kunci dari negara digital sistem.



sumber : http://mycandybaby.wordpress.com/2010/11/01/tangible-user-interface/

Head-Up Displays Systems

Q-HUD ™ adalah kinerja tinggi kepala-up sistem tampilan pesawat komersial yang lebih handal, harga kompetitif, dan adalah 50 persen lebih kecil dan lebih ringan daripada sistem generasi sekarang. Low-profile ini cocok unit yang lebih kecil dari banyak cockpits bisnis dan regional jet, dan menawarkan pilot rentang yang lebih besar kepala gerak.
Berdasarkanterobosan dalam teknologi optik yang dipatenkan, Q-sistem HUD memanipulasi cahaya menggunakan hologram waveguides, suntik foto dan data ke layar kaca di depan pilot bidang pandang. Gambar novel ini menghilangkan konsep generasi kebutuhan yang kompleks, berat, dan mahal-lensa proyeksi konfigurasi Common kepala tradisional-up display, di mana gambar diproyeksikan ke permukaan kaca, dan memungkinkan sistem Q-HUD untuk mengantarkan kedua akuisisi dan kehidupan -siklus penghematan biaya.
D-HUDS tidak hanya menawarkan penerbangan standar lengkap instrumentasi dan bimbingan untuk semua fase penerbangan, namun kini ditingkatkan dengan kualitas grafis yang lebih besar, disesuaikan simbologi, gambar video dukungan dan generasi baru dari EVS (Enhanced Vision System), SVS (Synthetic Vision System ), SGS (Bimbingan Permukaan System) kemampuan dan pertunjukan.
Dilengkapi dengan Head-Up Display Computer, D-HUDS integrasi fitur-fitur standar yang lebih tinggi, kontrol tampilan sederhana dan peningkatan rasio kontras dan luminositas untuk menghasilkan terang dan kualitas gambar paling tajam di pasar.
secara mudah HUD system membuat sebuah virtual dimana kita dapat mengetahui kondisi seperti melihat hologram. dari gambar disamping kita bisa melihat bahwa dengan sistem ini, lewat sebuah kaca spion si pengemudi dibantu/di tuntun melihat keadaan jalan yang sedang dihadapi….
*klo liat gambar yang ini, jadi inget film2 action yang udah mulai mutakhir teknologinya, cuma pake kacamata, dia bisa liat koordinat sekitarnya, HUD system berarti banyak digunakan juga untuk membantu polisi2 atau detektif2 dalam pekerjaan mereka yach..???
dari gambar bisa dilihat data2 koordinat yang disampaikan HUD system, tentang berapa ketinggian, posisi dan kesejajaran
sumber:
1. ARTIKEL
http://www.thalesgroup.com/Portfolio/Aerospace/Aerospace_Product_D-HUDSForCommercialApplications/?pid=1568
http://www.baesystems.com/ProductsServices/bae_prod_eis_q_hud.html
2. gambar
http://nihongono.typepad.com/.a/6a00d83452b27e69e2011168ee88f0970c-320wi
http://www.telovation.com/photos/holographic-heads-up-display.jpg
Original Post by Yulita Gracia