Machine Learning/Data Mining/Big Data — TechCave

Машинное обучение (англ Machine Learning) — обширный подраздел искусственного интеллекта, математическая дисциплина, использующая разделы математической статистики, численных методов оптимизации, теории вероятностей, дискретного анализа, и извлекающа

Machine Learning/Data Mining/Big Data

Машинное обучение (англ Machine Learning) — обширный подраздел искусственного интеллекта, математическая дисциплина, использующая разделы математической статистики, численных методов оптимизации, теории вероятностей, дискретного анализа, и извлекающая знания из данных.

Data Mining (рус. добыча данных, интеллектуальный анализ данных, глубинный анализ данных) — собирательное название, используемое для обозначения совокупности методов обнаружения в данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности.

Стена группы

Загрузка...
50 минут назад
#

Использование Grafana с IoT-платформой DeviceHive





Авторы: Игорь Трамбовецкий, Developer; Николай Хабаров, Embedded Expert

Платформа
DeviceHive содержит множество различных компонентов, включая плагин
Grafana. Он может собирать данные с сервера DeviceHive и отображать их с помощью различных информационных панелей, используя популярный инструмент Grafana. В этой статье я объясню, как создать дашборд Grafana с DeviceHive, а в качестве примера использую аналоговый вход чипа ESP8266 для визуализации напряжения на нем.



Источник
Загрузка...
Den
10 часов назад
#

Руководство по аналитике для основателя стартапа





Вам нужна аналитика.
Я совершенно уверен в этом, потому что сегодня всем нужна аналитика. Не только продуктовой команде, не только маркетингу или финансам, но и продажам, доставке, сегодня каждому в стартапе нужна аналитика. Аналитика помогает принимать все решения, от стратегических до тактических, как управляющим, так и рядовым сотрудникам.



Это пост о том, как создать аналитику в вашей организации. Речь пойдёт не о том, какие метрики отслеживать (об этом уже написано много хороших постов), а о том, как сделать так, чтобы ваш бизнес их генерировал. На практике выясняется, что на вопрос реализации —  как мне построить бизнес, который добывает данные для принятия решений? —  ответить гораздо труднее.



Источник
Загрузка...
Den
1 день назад
#

KDB



кдвп



Привет, Хабр !



В статье я опишу идею хранения в достаточно известной колоночной базе данных KDB, а так же примеры того, как к этим данным обращаться. База существует еще с 2001 года, и на данный момент занимает высокие места на сайтах со сравнением подобных систем (см., например, тут)



Источник
Загрузка...
1 день назад
#

Парсим мемы в питоне: как обойти серверную блокировку



Новогодние праздники — прекрасный повод попрокрастинировать в уютной домашней обстановке и вспомнить дорогие сердцу мемы из 2k17, уходящие навсегда, как совесть Electronic Arts.





Однако даже обильно сдобренная салатами совесть иногда просыпалась и требовала хоть немного взять себя в руки и заняться полезной деятельностью. Поэтому мы совместили приятное с полезным и на примере любимых мемов посмотрели, как можно спарсить себе небольшую базу
данных, попутно обходя всевозможные блокировки, ловушки и ограничения, расставленные сервером на нашем пути. Всех заинтересованных любезно приглашаем под кат.



Источник
Загрузка...
1 день назад
#

Сети и соседи: методы выживания машинного обучения в “дикой природе”. Открытый семинар AI@MIPT



image

Привет, Хабр! 22 января в 18:30 на Физтехе состоится очередная встреча из цикла семинаров по искусственному интеллекту. Приглашаем вас прокачаться и познакомиться с атмосферой Физтеха smile
Михаил Биленко, руководитель подразделения Machine Intelligence and Research в Яндексе и координатор деятельности исследовательской группы Яндекса в МФТИ, расскажет об уникальных отличиях академического и технологического машинного обучения. Семинар пройдет в 107 аудитории Биокорпуса МФТИ, зарегистрироваться можно
тут (не забудьте взять паспорт).

Источник
Загрузка...
1 день назад
#

Основы построения рекомендательных систем


Загрузка...
2 дня назад
#

Квартирник — Deep Learning на пальцах


Выступление на квартнике в Сан-Франциско, друзья попросили помахать руками и рассказать, что такое Deep Learning на пальцах.

Для просмотра знать про machine learning, deep learning и все эти слова не надо.

Организация, видео, аудио и монтаж: David Beholder
Слайды, мемы, плохие шутки: ваш покорный слуга

Загрузка...
2 дня назад
#

Hands-On Programming With R — Garrett Grolemund



Полный перевод книги Hands-on Programming With R — Garrett Grolemund на русский язык.



Приятного чтения!

Источник
Загрузка...
2 дня назад
#

Обучаемый Telegram чат-бот с ИИ в 30 строчек кода на Python



image

Сегодня мне в голову стукнула мысль: «А почему бы не написать Telegram чат-бота с ИИ, которого потом можно будет обучать?»

Источник
Загрузка...
2 дня назад
#

Тонкости резюме в немецкие IT компании. Часть 1



Приветствую всех талантливых программистов, веб-разработчиков, дизайнеров и просто коллег IT сферы, которые по любым причинам ищут информацию о Германии и работе в этой стране.

Источник
Загрузка...
2 дня назад
#

Как обучть мдль пнмть упртые скрщня



Недавно я натолкнулся на вопрос на Stackoverflow, как восстанавливать исходные слова из сокращений: например, из wtrbtl получать water bottle, а из bsktballbasketball. В вопросе было дополнительное усложнение: полного словаря всех возможных исходных слов нет, т.е. алгоритм должен быть в состоянии придумывать новые слова.



Вопрос меня заинтриговал, и я полез разбираться, какие алгоритмы и математика лежат в основе современных опечаточников (spell-checkers). Оказалось, что хороший опечаточник можно собрать из n-граммной языковой модели, модели вероятности искажений слов, и жадного алгоритма поиска по лучу (beam search). Вся конструкция вместе называется модель зашумлённого канала (noisy channel).



Вооружившись этими знаниями и Питоном, я за вечер создал с нуля модельку, способную, обучившись на тексте «Властелина колец» (!), распознавать сокращения вполне современных спортивных терминов.





Источник
Загрузка...
3 дня назад
#

Паблик «Щастьематринства» и его небольшое статистическое исследование



Введение (январь 2018)

Иногда люди берутся за дела с которыми сами справиться не могут. И я не исключение.

Есть такая интересная группа ВК —
#щастьематеринства(
https://vk.com/zaiki_luzhaiki ). Она представляет из себя один из самых феерических источников грубого реализма. Если вы хотите разочароваться в семье, детях, мужьях и всем чем угодно, вам туда. Экзистенциальный кризис вам обеспечен(хотя бы фактом того, что там пишут по 15 постов в день и это настоящие люди). И, конечно, этим паблик и во многом привлекателен.

В какой-то момент у меня и жены, которая работает
перинатальным психологом, возник интерес в исследовании того, что в этом паблике происходит. Например, наложить банальные статистические методы на содержание паблика, а вдруг чего интересного там есть. Особенно хотелось сделать какой-нибудь громкий вывод. Дескать паблик помогает людям… Или паблик рождает в людях ненависть… Или еще что-то такое выразительное.



Источник
Загрузка...
3 дня назад
#

Тонкая настройка нейронной сети | Глубокие нейронные сети на Python


Лекция по тонкой настройке (fine tuning) нейронной сети.
Страница курса — https://www.asozykin.ru/courses/nnpython

Тонкая настройка (fine tining) нейронной сети — это дообучение предварительно обученной части нейронной сети для решения других задач. Используется в процессе переноса обучения (transfer learning) для повышения качества работы сети.

Рассматривается пример тонкой настройки сети VGG16 для распознавания котов и собак на фотографиях — https://www.kaggle.com/c/dogs-vs-cats

После обучения нового классификатора, размораживается последний сверточный блок сети VGG16, который также обучается на фотографиях собак и кошек.

Для тонкой настройки обязательно использовать небольшео значение параметра скорости обучения (learning rate), в протином случае предварительно обученная сеть будет испорчена.

Загрузка...
3 дня назад
#

320+ Partners Developing on NVIDIA DRIVE


Загрузка...
4 дня назад
#

Пользователь Reddit под ником DeepFakes научил нейросети создавать интимные ролики со звездами



Правило 34

Пользователь Reddit под ником
DeepFakes научил нейросети создавать интимные ролики со звездами. Его жертвами уже стали: Эмма Уотсон, Мейси Уильямс, Скарлетт Йоханссон, Галь Гадот.

Для создавая подобных видео были использованы алгоритмы машинного обучения такие как TensorFlow, которые Google бесплатно предоставляет исследователям, аспирантам и всем, кто интересуется машинным обучением, а также материалы из открытого доступа.

С первого взгляда кажется правдоподобным, но на видео наблюдаются артефакты лицо не отслеживается правильно, хотя распознать фэйк не искушенному зрителю будет сложно.

image

Большой брат

Как инструменты Adobe, которые могут заставить людей говорить что-либо, и алгоритм Face2Face, который может подменять лица в режиме реального времени, этот новый тип поддельного видео показывает, что человечество находимся на грани, где легко создать правдоподобные видеоролики о том чего мы никогда не делали.

Источник
Загрузка...
2 3

Авторизация

Пользователи

Георгiй Москвитинъ
Andpyxa Tutunnik
Andrey_fox
Jane linch
genagy
Pasha Radiuk
KotikBSD
Эрик Имашев
Амир Исмагилов