Комплексные задачи компьютерного зрения через естественный язык

Источник

Комплексные задачи компьютерного зрения через естественный язык

Агентные системы для компьютерного зрения могут решать сложные композитные задачи по одному текстовому промпту. Пример: обнаружение акул и досок для сёрфинга в видео, отрисовка линий между ними, расчёт расстояния с учётом масштаба, условная логика (красная линия при расстоянии < 10 метров), сэмплирование видео и сохранение результата. Важно, что весь процесс остаётся прозрачным — код и инструкции доступны для проверки и редактирования.

Связи


Источник: Telegram, 2024-06-14

Связанные заметки

Хотите глубже изучить ai и автоматизация?

AI Product Engineer

85% выпускников запустили AI-фичу в production

Узнать о курсе

Исследуйте больше связей

Эта заметка — часть сети из 2,400+ взаимосвязанных идей. Откройте для себя неожиданные связи в интерактивном графе знаний.

Открыть граф знаний