Slovník
Computer Vision
Computer vision (počítačové vidění) je oblast umělé inteligence, která umožňuje počítačům interpretovat a rozumět vizuálním informacím z digitálních obrázků, videí nebo živých kamer. Cílem je replikovat schopnost lidského zraku – nejen detekovat objekty, ale chápat jejich kontext, vzájemné vztahy a prostorové uspořádání.
Moderní computer vision staví na hlubokých neuronových sítích, konkrétně na konvolučních sítích (CNN), které se trénují na milionech označených obrázků. Dnešní modely dosahují v řadě úloh přesnosti srovnatelné s lidskými experty – například při detekci nádorů na rentgenových snímcích nebo identifikaci výrobních defektů na výrobní lince.
Praktické aplikace jsou rozsáhlé: rozpoznávání obličejů pro autentizaci, autonomní vozidla identifikující chodce a dopravní značení, systémy kontroly kvality v průmyslu, rozšířená realita překrývající virtuální objekty do reálného světa nebo moderní e-shopy umožňující vyhledávání produktů podle fotografie. V medicíně se počítačové vidění používá k analýze histologických preparátů nebo zobrazovacích dat z MRI.
Pro webové vývojáře je computer vision dostupný prostřednictvím cloudových API od Googlu (Vision AI), Amazonu (Rekognition) nebo Microsoftu (Azure Computer Vision), které zvládnou integrovat pokročilé vizuální schopnosti bez nutnosti vlastního trénování modelů. Rostoucí výkon mobilních procesorů navíc přináší computer vision přímo do prohlížeče díky knihovnám jako TensorFlow.js.