Saat ini, berkat lompatan besar dalam kemampuan kecerdasan buatan, teknologi berbasis computer vision (CV) telah menjadi fitur utama dari banyak aplikasi dan perangkat, termasuk yang digunakan orang setiap hari.
Perangkat lunak biometrik pengenalan wajah tidak akan ada tanpa visi komputer. Mobil self-driving membutuhkannya untuk berkendara yang aman. Visi komputer diperlukan untuk analisis citra medis dan proses pemeriksaan jaminan kualitas robotik. Perusahaan saya, Shopic, menggunakan visi komputer untuk mengidentifikasi item yang ditempatkan di gerobak stiker.

Teknologi ini pada dasarnya menggunakan computer vision untuk mengotomatiskan proses yang berguna menggunakan data visual sebagai input. Sistem mencakup pemindaian perangkat keras dan algoritme yang memungkinkan mesin menganalisis, memproses, dan mengekstrak informasi dari gambar dan video digital. Ini sangat bergantung pada pembelajaran mesin, pembelajaran mendalam, dan jaringan saraf yang kompleks.
Dalam beberapa bulan terakhir, computer vision telah berkembang dengan cara yang baru dan menarik. Bagi sebagian orang, perubahan ini juga meresahkan, tetapi saya melihat potensi dan peluang di bidang ini. Di bawah ini adalah beberapa tren terkemuka yang saya yakini akan mendominasi industri pada tahap ini dan di masa mendatang.
Memperoleh ambang batas secara bertahap diturunkan
Kemajuan berkelanjutan dalam penyimpanan edge cloud telah menghasilkan perangkat edge seperti kamera digital dan sensor penglihatan yang mampu menjalankan pemrosesan computer vision di tempat daripada mengirimkannya ke cloud. Ini memindahkan pemrosesan AI computer vision ke perangkat edge, menurunkan latensi, dan mengurangi konsumsi energi dan bandwidth. Perusahaan seperti Nvidia sedang mengembangkan layanan edge cloud untuk meningkatkan penerapan sumber daya computer vision. Menyingkirkan pemrosesan dan penyimpanan cloud yang mahal menurunkan biaya adopsi dan membuat sistem CV lebih mudah diakses dan terjangkau. Perpindahan ke pemrosesan edge juga meningkatkan privasi data untuk aplikasi visi komputer, mengatasi masalah kepatuhan yang sebelumnya mengganggu adopsi oleh banyak perusahaan.
Aplikasi visi komputer berkembang
Karena hambatan untuk adopsi semakin rendah, semakin banyak industri yang menerapkan visi komputer dalam lebih banyak kasus penggunaan. Perawatan kesehatan adalah salah satu bidang yang tertarik untuk mengadopsi visi komputer, yang dapat memungkinkan diagnosis pencitraan yang lebih akurat dan layanan medis jarak jauh, dengan janji operasi yang dibantu robot.
Kami telah menyaksikan pertumbuhan kasus penggunaan visi komputer di industri ritel, termasuk sistem belanja swalayan dan toko tanpa kasir. Kendaraan swakemudi dan peralatan keselamatan jalan menggunakan visi komputer untuk meningkatkan keselamatan, petani menggunakan visi komputer untuk pemantauan tanaman dan deteksi penyakit, dan sistem VSLAM menggunakan visi komputer untuk memberikan pemetaan yang lebih akurat untuk bantuan bencana, prakiraan cuaca, dan banyak lagi.
Karena kasus penggunaan terus menumpuk, pasar computer vision akan berkembang. Data Global memperkirakan bahwa pasar visi komputer akan tumbuh dari $17,73 miliar pada tahun 2023 menjadi $30,3 miliar pada tahun 2026.
sistem menjadi lebih kompleks
Karena algoritme kecerdasan buatan yang mendasari solusi visi komputer menjadi lebih kuat, sistem visi komputer akan meningkatkan kemampuannya untuk mengenali objek dan wajah. Ini akan memungkinkan sistem penglihatan komputer untuk mendeteksi emosi dan melacak gerakan tubuh dengan lebih tepat, membuka kemampuan baru untuk wawasan perilaku dan deteksi anomali. Sementara pemantauan individu sangat bermasalah dan telah menjadi sorotan dalam beberapa tahun terakhir, analisis sentimen kerumunan yang dianonimkan adalah salah satu kasus penggunaan etis.
Kami juga melihat sistem visi komputer mengembangkan model dan metode pemrosesan gambar yang inovatif. "Model perhatian" saat ini pada dasarnya adalah teknik pemrosesan input yang memungkinkan jaringan saraf untuk fokus pada bagian tertentu dari gambar atau video yang kompleks, memungkinkan sistem visi komputer untuk memahami setiap bagian dari gambar yang sibuk atau frekuensi awal. Selain itu, "Graph Neural Networks" menerapkan prediksi pembelajaran mendalam untuk struktur data kaya relasional, meningkatkan visi komputer, memahami, dan menginterpretasikan konteks.
Menghubungkan data visual dengan sumber data lain dapat memperkaya keseluruhan konteks dan pemahaman peristiwa, seperti halnya manusia menggabungkan penglihatan dengan indra angin, persepsi kecepatan, dan suara latar sekitar untuk memahami dunia di sekitar mereka. Dengan cara ini, solusi CV dapat memahami dan mengekstraksi wawasan dari keseluruhan adegan dalam konteks yang lebih luas, bukan hanya segmen yang dipilih
Kematangan ini akan memungkinkan interpretasi dan analisis yang lebih akurat, pengambilan keputusan yang lebih baik, dan utilitas yang lebih besar dalam situasi yang kompleks dan cepat berubah seperti pabrik manufaktur yang sibuk atau jalanan kota.
AR memasuki era baru
Solusi augmented reality (AR) saat ini dapat menghasilkan penampakan 3D interaktif dari lingkungan dunia nyata mana pun, dengan penyesuaian terbatas yang dilakukan dengan melacak perubahan cahaya pada permukaan planar. Mereka dapat merespons pergerakan pengguna melalui pelacakan kepala dan pengontrol, tetapi tidak lebih.
Namun, integrasi kamera visi komputer dengan solusi pelacakan mata dan giroskop mulai menghasilkan sistem yang lebih kompleks. Solusi visi komputer yang disempurnakan (CV-enhanced AR) dapat melihat seluruh lingkungan pengguna, memandu pengguna untuk menghindari rintangan, menyesuaikan lingkungan virtual sesuai dengan gerakan tubuh pengguna, dll.
Ini memiliki implikasi penting untuk perangkat bantu, aplikasi navigasi, dan pengalaman bermain game/metaverse.
tantangan tetap ada
Terlepas dari perkembangan dan janji visi komputer yang luar biasa, para pemimpin di lapangan masih menghadapi beberapa tantangan. Karena visi komputer adalah bidang yang relatif baru di dunia komersial, ada kelangkaan ahli dalam mengembangkan dan meluncurkannya dalam skala besar. Perusahaan perlu meningkatkan keterampilan karyawan mereka untuk memenuhi tuntutan ini.
Sebagai sebuah industri, kami juga perlu mengatasi masalah terkait privasi, kepercayaan, dan penggunaan etis dengan lebih baik. Kuncinya adalah memiliki pengumpulan data yang ketat, baik sepenuhnya ikut serta atau benar-benar dianonimkan. Sistem visi komputer harus mematuhi peraturan privasi yang terus berkembang dan tuntutan publik akan privasi.
"Ada peningkatan kebutuhan akan transparansi dan penjelasan dalam AI. Visi komputer tidak bisa hanya berupa kotak hitam, tetapi model AI yang diandalkannya sangat kompleks sehingga sulit untuk membuatnya dapat dijelaskan." Orang yang bertanggung jawab untuk menerapkan sistem AI akan berusaha lebih keras untuk memastikan mereka dapat menjelaskan bagaimana keputusan dibuat dan informasi apa yang digunakan untuk membuatnya. "Tetapi ketika visi komputer menjadi lebih kompleks, tantangannya meningkat," tulis Bernard Marr.
Visi komputer masih dalam tahap awal
Seperti solusi AI lainnya, visi komputer maju dengan kecepatan cahaya, dengan pendekatan, aplikasi, kasus penggunaan, dan kemampuan baru yang muncul setiap saat. Dalam lingkungan yang berubah begitu cepat, sulit untuk memprediksi apa yang akan terjadi di masa depan.
Meski masih banyak tantangan yang harus diatasi, terutama terkait privasi dan etika penggunaan, sistem visi komputer menjanjikan kemampuan baru untuk banyak industri, membuka peluang baru bagi semua pihak yang terlibat.






