В группе рассматриваются алгоритмы, методы, библиотеки обработки и распознавания изображений. Также можно очень много узнать про библиотеки машинного зрения, такие как, OpenCV или CCV. OpenCV что это такое? OpenCV (англ.

Рейтинг: 15
Создана: 11 лет назад
Владелец: root

OpenCV/Обработка и распознавание изображений

Основная информация

В группе рассматриваются алгоритмы, методы, библиотеки обработки и распознавания изображений. Также можно очень много узнать про библиотеки машинного зрения, такие как, OpenCV или CCV.

OpenCV что это такое? OpenCV (англ. Open Source Computer Vision Library, библиотека компьютерного зрения с открытым исходным кодом) — библиотека алгоритмов компьютерного зрения, обработки изображений и численных алгоритмов общего назначения с открытым кодом. Реализована на C/C++, также разрабатывается для Python, Ruby, Matlab, Lua и других языков. Может свободно использоваться в академических и коммерческих целях — распространяется в условиях лицензии BSD.

Распознавание образов что это? Распознавание образов — это научная дисциплина, целью которой является классификация объектов по нескольким категориям или классам. Объекты называются образами.

CCV (A Modern Computer Vision Library), небольшая библиотека современных алгоритмов машинного зрения.

Стена группы

Загрузка...
7 лет назад
#

Преобразование цветовой температуры (K) в RGB: алгоритм и пример кода





Если вы не знаете, что такое цветовая температура,
начните отсюда.

Работая над инструментом «Цветовая температура» для
PhotoDemon, я целый вечер пытался определить простой и понятный алгоритм преобразования между значениями температуры (в Кельвинах) и RGB. Я думал, что такой алгоритм будет просто найти, ведь во многих фоторедакторах есть инструменты для коррекции цветовой температуры, а в каждой современной камере, включая смартфоны, есть регулировка баланса белого на основе условий освещения.

Источник
7 лет назад
#

Обучение и тестирование нейронных сетей на PyTorch с помощью Ignite



Привет, Хабр, в этой статье я расскажу про библиотеку ignite, с помощью которой можно легко обучать и тестировать нейронные сети, используя фреймворк PyTorch.



С помощью ignite можно писать циклы для обучения сети буквально в несколько строк, добавлять из коробки расчет стандартных метрик, сохранять модель и т.д. Ну, а для тех кто переехал с TF на PyTorch, можно сказать, что библиотека ignite — Keras для PyTorch.



В статье будет детально разобран пример обучения нейронной сети для задачи классификации, используя ignite





Источник
Den
7 лет назад
#

Xception: компактная глубокая нейронная сеть



В последние несколько лет нейронные сети пробрались во все отрасли машинного обучения, но самый большой фурор они бесспорно произвели в области компьютерного зрения. В рамках соревнований
ImageNet было представлено множество различных архитектур свёрточных сетей, которые затем разошлись по фреймворкам и библиотекам.



Чтобы улучшить качество распознавания своих сетей, исследователи старались добавлять в сети больше слоёв, однако со временем пришло понимание, что иногда ограничения производительности попросту не позволяют обучать и использовать настолько глубокие сети. Это стало мотивацией для использования depthwise separable convolutions и создания архитектуры Xception.

Если вы хотите узнать, что это такое, и посмотреть, как использовать такую сеть на практике, чтобы научиться отличать котов от собак, добро пожаловать под кат.

Источник
7 лет назад
#

Обнаружение лиц на видео с помощью Movidius Neural Compute Stick



Не так давно в свет вышло устройство
Movidius Neural Compute Stick (NCS), представляющее собой аппаратный ускоритель для нейронных сетей с USB интерфейсом. Меня заинтересовала потенциальная возможность применения устройства в области робототехники, поэтому я приобрел его и задумал запустить какую-нибудь нейросеть. Однако большинство существующих примеров для NCS решают задачу классификации изображений, а мне хотелось попробовать кое-что другое, а именно обнаружение лиц. В этой публикации я хотел бы поделиться опытом, полученным в ходе такого эксперимента.

Весь код можно найти
на GitHub.

image

Источник
7 лет назад
#

Знакомые лица: алгоритмы создания «типичного» портрета





Автор: Андрей Сорокин, Senior Developer DataArt

В конце прошлого года мы завершили R&D-проект, посвященный методам машинного зрения в обработке изображений. В результате мы создали ряд усредненных портретов IT-специалистов, работающих с разными технологиями. В этой статье я расскажу об изображениях «типичных» Java и .NET-программистов, подходящих для этого фреймворках и оптимизации процесса.

Тема машинного зрения меня интересует еще с аспирантуры — моя кандидатская была посвящена распознаванию рукописных текстов. За последние несколько лет произошли существенные изменения в методологии и программном обеспечении для машинного зрения, появились новые инструменты и фреймворки, которые хотелось попробовать. В этом проекте мы не претендовали на изобретение уникального решения — главный вклад мы внесли в оптимизацию обработки изображений.

Источник
7 лет назад
#

Безопасность футбольных стадионов: некоторые неявные особенности





Пример монтажа на стадионе ЦСКА

Итальянские и английские футбольные фанаты считались самыми агрессивными. Но теперь они дома не бузят. Почему? Потому что их лишают пожизненно права посещения стадионов. Поэтому они бузят на евро, на ЧМ, во Франции. У нас тоже начинается такое: особо эмоциональные фанаты легко могут словить запрет на посещение арены на достаточно продолжительный срок.

Начну с того, что если вы набедокурите, то сотрудники безопасности стадиона заботливо занесут ваши биометрические данные лица в систему видеонаблюдения согласно законному решению суда. Когда вы в следующий раз появитесь на стадионе, вас уверенно распознают и сообщат об этом сотрудникам безопасности. Вопрос с персональными данными и свободой договора (билет — это договор) решается элегантно: на стадии «набедокурил» на вас просто подают в суд и получают заключение, с которым уже можно действовать дальше.

Вообще, есть два мифа про безопасность на стадионах:

  1. Что видеонаблюдение не помогает в предотвращении преступлений.

  2. И что биодетекторы — это прошлый век.



Источник
8 лет назад
#

Итоги развития компьютерного зрения за один год



Часть первая. Классификация/локализация, обнаружение объектов и слежение за объектом

Этот фрагмент взят из недавней публикации, которую составила наша научно-исследовательская группа в области компьютерного зрения. В ближайшие месяцы мы опубликуем работы на разные темы исследований в области Искусственного Интеллекта  —  о его экономических, технологических и социальных приложениях — с целью предоставить образовательные ресурсы для тех, кто желает больше узнать об этой удивительной технологии и её текущем состоянии. Наш проект надеется внести свой вклад в растущую массу работ, которые обеспечивают всех исследователей информацией о самых современных разработках ИИ.


Полная публикация доступна бесплатно на нашем веб-сайте:
www.themtank.org.

Введение

Компьютерным зрением обычно называют научную дисциплину, которая даёт машинам способность видеть, или более красочно, позволяя машинам визуально анализировать своё окружение и стимулы в нём. Этот процесс обычно включает в себя оценку одного или нескольких изображений или видео. Британская ассоциация машинного зрения (BMVA)
определяет компьютерное зрение как
«автоматическое извлечение, анализ и понимание полезной информации из изображения или их последовательности».

Термин
понимание интересно выделяется на фоне механического определения зрения — и демонстрирует одновременно и значимость, и сложность области компьютерного зрения. Истинное понимание нашего окружения достигается не только через визуальное представление. На самом деле визуальные сигналы проходят через оптический нерв в первичную зрительную кору и осмысливаются мозгом в сильно стилизованном смысле. Интерпретация этой сенсорной информации охватывает почти всю совокупность наших естественных встроенных программ и субъективного опыта, то есть как эволюция запрограммировала нас на выживание и что мы узнали о мире в течение жизни.

Источник
8 лет назад
#

Сравнительное тестирование Smart IDReader на 5-ти вычислительных комплексах с процессорами Эльбрус



Smart IDReader — приложение, позволяющее распознавать удостоверяющие документы на различных платформах. Различные режимы распознавания позволяют извлекать данные держателя документа из видеопотока, фотографий или сканов документов.





Сегодня мы решили рассказать вам о том как мы тестировали Smart IDReader на семействе вычислительных систем Российского производства — Эльбрус. На чем будем тестировать? Как работает распознавание документов на новой машине Эльбрус-8.4? Если интересно, идем под кат.



Источник
8 лет назад
#

Время отклика компьютеров: 1977−2017



У меня гнетущее чувство, что современные компьютеры по ощущениям медленнее, чем те компьютеры, которые я использовал в детстве. Я не доверяю такого рода ощущениям, потому что человеческое восприятие доказало свою ненадёжность в эмпирических исследованиях, так что я взял высокоскоростную камеру и измерил время отклика устройств, которые попали ко мне за последние несколько месяцев. Вот результаты:

Компьютер Отклик

(мс) Год Тактовая

частота Кол-во

транзисторов Apple 2e 30 1983 1 МГц 3,5 тыс. TI 99/4A 40 1981 3 МГц 8 тыс. Haswell-E
165 Гц 50 2014 3,5 ГГц 2 млрд Commodore Pet 4016 60 1977 1 МГц 3,5 тыс. SGI Indy 60 1993 0,1 ГГц 1,2 млн Haswell-E
120 Гц 60 2014 3,5 ГГц 2 млрд ThinkPad 13
ChromeOS 70 2017 2,3 ГГц 1 млрд iMac G4
OS 9 70 2002 0,8 ГГц 11 млн Haswell-E
60 Гц 80 2014 3,5 ГГц 2 млрд Mac Color Classic 90 1993 16 МГц 273 тыс. PowerSpec G405
Linux
60 Гц 90 2017 4,2 ГГц 2 млрд MacBook Pro 2014 100 2014 2,6 ГГц 700 млн ThinkPad 13
Linux chroot 100 2017 2,3 ГГц 1 млрд Lenovo X1 Carbon 4G
Linux 110 2016 2,6 ГГц 1 млрд iMac G4
OS X 120 2002 0,8 ГГц 11 млн Haswell-E
24 Гц 140 2014 3,5 ГГц 2 млрд Lenovo X1 Carbon 4G
Win 150 2016 2,6 ГГц 1 млрд Next Cube 150 1988 25 МГц 1,2 млн PowerSpec G405
Linux 170 2017 4,2 ГГц 2 млрд Пакет вокруг света 190 PowerSpec G405
Win 200 2017 4,2 ГГц 2 млрд Symbolics 3620 300 1986 5 МГц 390 тыс.

Источник
8 лет назад
#

Сверточная сеть на python. Часть 3. Применение модели





Это заключительная часть статей о сверточных сетях. Перед прочтением рекомендую ознакомиться с
первой и
второй частями, в которых рассматриваются слои сети и принципы их работы, а также формулы, которые отвечают за обучение всей модели. Сегодня мы рассмотрим особенности и трудности, с которыми можно столкнуться при тестировании вручную написанной на python сверточной сети, применим написанную сеть к датасету MNIST и сравним полученные результаты с библиотекой tensorflow.

Источник
8 лет назад
#

Рубрика «Читаем статьи за вас». Октябрь — Ноябрь 2017





Привет, Хабр! По традиции, представляем вашему вниманию дюжину рецензий на научные статьи от членов сообщества Open Data Science из канала #article_essense. Хотите получать их раньше всех — вступайте в сообщество ODS!



Статьи выбираются либо из личного интереса, либо из-за близости к проходящим сейчас соревнованиям. Напоминаем, что описания статей даются без изменений и именно в том виде, в котором авторы запостили их в канал #article_essence. Если вы хотите предложить свою статью или у вас есть какие-то пожелания — просто напишите в комментариях и мы постараемся всё учесть в дальнейшем.



Статьи на сегодня:



Источник
8 лет назад
#

Эволюция «img»: Gif без формата GIF



image

tl;dr

  • GIF — это круто, но в плане качества и производительности они ужасны.

  • Замена GIF на video хорошая идея, но есть недостатки: они не подгружаются предварительно, используют range запросы.

  • Сегодня вы можете использовать img src =".mp4" в Safari Technology Preview.

  • Предварительные результаты показывают, что mp4s в тегах отображаются в 20 раз быстрее и декодируются в 7 раз быстрее, чем GIF-эквивалент — в дополнение к тому, что размер файла равен 1/14!

  • Фоновые CSS-видео и адаптивные видео теперь могут быть «вещью».

  • Наконец, синемаграфы будут без недостатков GIF.

  • Теперь мы ждем, когда другие браузеры пойдут следом: этот пост весит — 46 МБ на Chrome, и всего 2 МБ в Safari TP.



Особая благодарность: Эрику Портису, Джеку Ноблу, Джону Дэвису, Дорону Шерману и Йоаву Вайсу.

Источник
8 лет назад
#

Капсульные сети от Хинтона





27 октября 2017 года появилась
статья доктора Джофри Хинтона с соавторами из Google Brain. Хинтон — более чем известный ученый в области машинного обучения. Он в свое время разработал математику обратного распространения ошибок, был научным руководителем Яна Лекуна — автора архитектуры сверточных сетей.

Хоть презентация была достаточно скромная, корректно говорить о революционном изменении подхода к искусственным нейронным сетям (ИНС). Назвали новый подход «капсульные сети». Пока в российском сегменте интернета мало информации о них, поэтому восполню этот пробел.

Источник
8 лет назад
#

Можно ли запихнуть распознавание номеров в любой тамагочи?



Про распознавание номеров мы рассказываем на Хабре давным давно. Надеюсь даже интересно. Похоже настало время рассказать как это применяется, зачем это вообще нужно, куда это можно запихнуть. А самое главное — как это изменяется в последние годы с приходом новых алгоритмов машинного зрения.



Источник
Den
8 лет назад
#

Биороботы нашего времени — избавляемся от рутины вместе с Telegram. Реальный кейс без фантазий



В интернетах не прекращается хайп вокруг чат-ботов — в частности Telegram — благодаря шуму в СМИ, неоспоримых достоинствах платформы, политике продвижения, средствам разработки и т.д.

Смотришь новости: ну
жизни нет без чат-ботов!

Да если их не будет — поезда с рельс сойдут, упадут самолеты, погибнут люди от тоски, когда не смогут найти картинки с котиками.

Но давайте положим руку на сердце: когда последний раз вы что-то заказывали в интернет магазине
через чат-бот?

Кто все эти люди, которые заказывают разработку ботов для своих магазинов?

Типичный чат-бот магазина Vasya Limited:

>> автоматизирует поток водопад заявок из
5 человек в день.

>> сливает 4 из 5 заявок, кровью добытых через Яндекс-Директ

>> если повезет — человек найдет номер телефона и позвонит

>> но вероятней всего «Эээ — куда жать?»- закроет и уйдет гуглить дальше.

Чем занят владелец, когда продажи «автоматизированы»:

>> вносит заказы в excel таблицу

>> заполняет почтовые бланки на посылках

>> стоит в очереди на почте с кучей посылок (каждый день!)

>> вносит трек номера в excel таблицу, затем рассылает клиентам

Может хватит на ровном месте встраивать «технологии» туда, где действительно нужен человек, в то время как люди загружены рутиной для роботов?

Источник
1 3 4

Авторизация

Войдите, используя Ваш аккаунт

Войти с помощью

Пользователи

Skyeng
GeekBrains
Lingualeo