Machine Learning/Data Mining/Big Data — TechCave

Машинное обучение (англ Machine Learning) — обширный подраздел искусственного интеллекта, математическая дисциплина, использующая разделы математической статистики, численных методов оптимизации, теории вероятностей, дискретного анализа, и извлекающа

Machine Learning/Data Mining/Big Data

Машинное обучение (англ Machine Learning) — обширный подраздел искусственного интеллекта, математическая дисциплина, использующая разделы математической статистики, численных методов оптимизации, теории вероятностей, дискретного анализа, и извлекающая знания из данных.

Data Mining (рус. добыча данных, интеллектуальный анализ данных, глубинный анализ данных) — собирательное название, используемое для обозначения совокупности методов обнаружения в данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности.

Стена группы

Загрузка...
3 дня назад
#

Нейросеть генерирует изображения блюд по рецептам их приготовления





Сравнение настоящих фотографий (вверху), сгенерированных изображений с семантической регуляризацией (средний ряд) и без неё

Группа исследователей из Тель-Авивского университета разработала нейронную сеть, способную генерировать изображения блюд по их текстовым рецептам. Таким образом, домохозяйка может заранее посмотреть, что получится в итоге, если изменить тот или иной пункт рецепта: добавить новый ингридиент или убрать какой-то из существующих. В принципе, эта научная работа — хорошая идея для коммерческого приложения, тем более что исходный код программы
опубликован в открытом доступе.

Источник
Загрузка...
6 дней назад
#

Кое-что нашли: доклады с Elasticsearch Moscow meetup в OZON



image

Для тех, кто досмотрел все сезоны новых и любимых сериалов, у нас есть кое-что поинтереснее — видео с Elasticsearch meetup в OZON.

Источник
Загрузка...
6 дней назад
#

Микроэлектроника, нейрофизиология и машинное обучение, взболтать, но не перемешивать



В середине 2018 года была
опубликована работа по электрофизиологии головного мозга крыс, совместно с которой был выложен в открытый доступ один
уникальный набор данных. Уникальность датасета состоит в том, что в нем присутствуют одновременные записи локального полевого потенциала с помощью нового высокоплотного электрода
Neuropixels (проба, или probe) и патч-электрода от клетки, находящейся вблизи пробы. Интерес к подобным записям не только фундаментальный, но и прикладной, потому что позволяет валидировать модели для анализа нейрональной активности, зарегистрированной современными пробами. А это, в свою очередь, непосредственно касается разработки новых нейропротезов. В чем принципиальная новизна, и почему этот датасет такой важный, — я расскажу под катом.



КДПВ: результат моделирования внеклеточного потенциала вблизи одного нейрона при генерации потенциала действия (источник). Цветом обозначена амплитуда потенциала. Данная иллюстрация будет важна для дальнейшего понимания.

Источник
Загрузка...
6 дней назад
#

В России разрабатывают процессор для ускорения нейросетей



Четыре российские компании объединились для создания первого отечественного процессора, предназначенного для радикального повышения производительности компьютерных нейронных сетей,
пишут «Известия». Эксперты сказали в комментариях газете, что российский чип должен быть вполне конкурентоспособен на «только формирующемся мировом рынке нейропроцессоров».

Нейронные процессоры — это специализированные чипы, которые осуществляют аппаратное ускорение работы алгоритмов искусственных нейронных сетей, компьютерного зрения, распознавания по голосу, машинного обучения и других методов искусственного интеллекта. Первые попытки производства таких микросхем, которые специализируются на распознавании образов,
предпринимались в 1993 году, а сейчас такими уже никого не удивишь. А тем более использованием GPU для ускорения нейронных вычислений, что почти так же эффективно, как и специализированный ASIC.

Тем не менее, отечественные СМИ пишут о «процессоре для искусственного разума», а также об
уникальном квантовом компьютере и других революционных достижениях российских учёных и инженеров.

Источник
Загрузка...
6 дней назад
#

Data Science: книги для начального уровня



Data Science — наука о данных, возникшая на стыке нескольких обширных направлений: программирования, математики и машинного обучения. Этим обусловлен высокий порог вхождения в профессию и необходимость постоянно получать новые знания.

Ключевыми навыками для начинающих специалистов являются:

  • умение писать код (Python);

  • способность визуализировать свои результаты;

  • понимание того, что происходит «под капотом».



На эти три категории разделены книги, которые специалисты Plarium Krasnodar подобрали для читателей с начальными знаниями в Data Science.



Источник
Загрузка...
6 дней назад
#

Использовать машинное обучение не сложно. Для этого достаточно в течение недели…



image



В прошлых статьях я попытался рассказать про основы ценообразования и построения дерева принятия решений покупателя для классического ритейла. В данной статье расскажу про очень нестандартный кейс и постараюсь убедить вас, что использовать машинное обучение не так сложно, как кажется. Статья менее техничная и скорее призвана показать, что можно начать с малого и это уже принесет ощутимую пользу для бизнеса.



Источник
Загрузка...
Den
6 дней назад
#

Бот генерирует учебники из статей Википедии





Пример викиучебника (иллюстрация из научной статьи)

Всем известно, что Википедия — ценный информационный ресурс. Можно часами изучать тему, переходя от одной ссылки к другой для получения контекста по интересующему предмету. Но не всегда очевидно, как собрать весь контент по какой-либо одной общей теме. Например, как объединить все статьи по неорганической химии или истории средних веков, резюмируя самое важное? Примерно это попытались сделать Шахар Адмати и его коллеги из Бена-Гуриона в Негеве (Израиль), разработчики программы машинного обучения
Wikibook-Bot.

Источник
Загрузка...
8 дней назад
#

zoomcall #6 09.01.2019 (Speed-up DNN, Spiking neural networks)


Темы:

1. Иван Брагин — «Основные методы ускорения нейронных сетей»
2. Александр Шеховцов — «Spiking neural networks»

Слайды

https://github.com/sheh/ml-meetups/tr...

Загрузка...
10 дней назад
#

Kaggle YouTube-8M 2: классификация видео — Глеб Стеркин, Владимир Алиев


Глеб Стеркин и Владимир Алиев вместе со своей командой заняли 4 место в конкурсе Kaggle The 2nd YouTube-8M Video Understanding Challenge. Как и в прошлом году стояла задача в классификации большого объёма видео, но в этот раз с ограничениями на размер модели. В видео участники рассказывают про использованные модели, многоуровневый подход с нейронными сетями и градиентным бустингом, сравнивают различные подходы.

Слайды: https://gh.mltrainings.ru/presentatio…


Загрузка...
14 дней назад
#

DeepMind’s Take on How To Create a Benign AI


1. https://arxiv.org/abs/1811.07871
2. https://medium.com/@deepmindsafetyres...

Загрузка...
22 дня назад
#

Face Recognition Ivideon: самая доступная система распознавания лиц для бизнеса



image

Мы долго шли к этому дню. Ещё в 2012 году на Хабре мы объявили конкурс на создание демонстрационного приложения с использованием OpenCV для слежения за несколькими объектами и, в конечном счете, для запуска сервиса детекции лиц.

Наша цель – сделать функции видеоанализа, которые присутствуют в дорогостоящих профессиональных решениях, доступными для любого пользователя. Мы думали, что быстро достигнем намеченной цели, но недооценили сложность задачи.

Проблему можно было решить, создав собственную систему. Но оказалось, что это долго и дорого для клиентов. Мы выбрали второй путь – стать интеграционной платформой для сторонних поставщиков модулей распознавания лиц.

Хотя за кадром остаются годы поиска и тестов, давайте сразу посмотрим, как сейчас работает наше решение для малого и среднего бизнеса. Почему для них? Раньше системы такого уровня устанавливали в аэропортах, метро или в периметре крупных предприятий. Теперь Ivideon
запускает бета-релиз модуля распознавания лиц по доступным для всех тарифам от 1 700 рублей.

Источник
Загрузка...
22 дня назад
#

4 секрета, как не потерять работу в data science



Переводчик Елена Борноволокова специально для Нетологии адаптировала статью американского аналитика Тавиша Шриваставы о том, как процесс автоматизации влияет на data scientist.

Введение

Автоматизация влияет на профессиональную деятельность во всех отраслях. С одной стороны, автоматизация помогает эффективнее управлять бизнесом, а с другой – ведет к постоянному изменению набора необходимых навыков.

Несоответствие необходимому набору навыков приводит к потере работы. Проиллюстрирую эту мысль двумя сценариями.

Сценарий 1 – Ручной труд



Источник
Загрузка...
22 дня назад
#

Я у мамы алготрейдер: ищем бесплатные фреймворки для тестирования гипотез и запуска в боевом режиме (Python)



Допустим, вы имели какое-то отношение к фондовому рынку раньше. Или, не имея такового, увлеклись горячей (но в последние месяцы уже заметно похолодевшей....) темой криптовалют. Также предположим, что вы пошли еще дальше и решили, что «ручное управление» полетами уже неэффективно и надо бы автоматизировать свои светлые идеи и превратить мартышкин труд в нечто более технологичное. Ровно на этом моменте начинаются вопросы, которые я хотел бы обсудить в статье, а именно: есть ли готовое решение для бэктестинга торговых идей (бесплатное желательно), где взять исторические данные (в идеале бесплатно), а также что с этим всем потом делать, т.е. какие существуют решения для боевого запуска автоматизированных торговых систем, успешно проверенных на бэктесте? Примечание первое и второе: статья написана для Python-based библиотек и систем, как дела с доступностью для других языков судить не могу; в приоритете — зарубежные рынки и/или криптовалюты, относительно применимости к фондовому рынку РФ судить также не берусь.

image

Источник
Загрузка...
22 дня назад
#

Новогодний датасет 2018: открытая семантика русского языка



Открытая семантика русского языка, об истории создания которой вы можете прочитать
здесь и
здесь, получила большое обновление. Мы собрали достаточное количество данных, чтобы применить поверх собранной разметки машинное обучение и построить семантическую модель языка. Что из этого получилось смотрите под катом.



Источник
Загрузка...
22 дня назад
#

Предсказываем время решения тикета с помощью машинного обучения



Оформляя тикет в системе управления проектами и отслеживания задач, каждый из нас рад видеть ориентировочные сроки решения по своему обращению.
Получая поток входящих тикетов, человеку/команде необходимо выстроить их в очередь по приоритету и по времени, которое займет решение каждого обращения.
Все это позволяет эффективнее планировать своё время обеим сторонам.



Под катом я расскажу о том, как проводил анализ и обучал ML модели, предсказывающие время решения оформляемых в нашу команду тикетов.



Источник
Загрузка...
2 3

Авторизация

Пользователи

Kumskov
Juan
Tutu
naikdij88
NewEXE
Георгiй Москвитинъ
Andpyxa Tutunnik
Andrey_fox
Jane linch

GeekBrains

Нетология