1. Основы Data Science и Big Data. Дэви Силен, Арно Мейсман, Мохамед Али
Data Science – это набор определений и концепций, с помощью которых можно наделить значением и доступным видом большие объёмы данных. Книга рассказывает об одной главной и увлекательной концепции анализа и обработки данных.
Читателя познакомят с теоретической основой, последовательностью машинного обучения, работой с большими массивами данных, NoSQL, детальным анализом текстов и визуальной информацией. В качестве примеров представлены сценарии Data Science на Python.
Обработка и анализ данных – это широко применимая отрасль в IT, именно здесь необходимы талантливые разработчики, способные создавать сценарии разной сложности, от социальных сетей до обучаемых систем. Книга послужит начальной точкой в изучении мира Data Science.
3. Наука о данных. Джон Келлехер, Брендан Тирни
В современном мире наука о данных находит применение во всех областях: рекламные объявления в интернете подбираются под запросы пользователя, рекомендованное высвечивается из-за анализа просмотренных сериалов и прочитанных книг, ссылки в социальных сетях появляются по методу «знакомые», а также отсортированные входящие уходят в отдельную папку со спамом.
Читателя познакомят с базовыми принципами науки о данных. В неё включены основные аспекты, от момента становления сбора и анализа данных, до решения этических конфликтов, нарастающих из-за политики конфиденциальности. Читателю расскажут, как ведут работу нейронные сети и машинное обучение, приведут примеры изучения бизнес-проблем и покажут пути их решения. Дополнительно расскажут о тех областях, на которые наука о данных повлияет в большей степени.
5. Убийственные большие данные. Кэти О’Нил
Математические алгоритмы постепенно захватывают нашу жизнь. Кэти О’Нил – это профессор математики и финансовый аналитик, считающая, что алгоритмы стали серьёзным оружием в руках государства и предприятий – это оружие изначально направлено на нуждающиеся и незащищённые слои населения.
Современные математические приложения, созданные для банков и страховых компаний, способны следить за каждым действием человека в пространстве интернета. Однако они появлялись на основе предрассудков и убеждений, которыми грешат их создатели. Основа и критерии реализации математических алгоритмов подлежат охране и строгому контролю. Добро пожаловать в мир убийственных Больших данных!
7. Практическая статистика для специалистов Data Science. Питер Брюс, Эндрю Брюс
Практический учебник представлен для специалистов в сфере данных, обладающих навыком работы с языком программирования и знакомых с определением математической статистики. Здесь в доступном виде представлены основные моменты из статистики науки о данных, также объясняется, какие критерии необходимы и полезны со стороны анализа данных. Детально рассматриваются предметы:
- разведочный анализ данных;
- распределение данных и выборок;
- статистические эксперименты и проверка значимости;
- статистическое машинное обучение и обучение без учителя.
9. Data Science. Наука о данных с нуля. Джоэл Грас
Читателя познакомят с миром науки о данных и научат применять знания в практической среде. Легкодоступный способ изложения помогает неопытному, но интересующемуся человеку понять аналитику без возможных сложностей.
Джоэл Грас рассказывает о языке Python, элементах линейной алгебры, математической статистике, методах сбора, нормализации и обработки данных. Дополнительно даёт информационную базу для машинного обучения. Описывает математические модели и пути их разработки по принципу «k».
11. Изучаем Spark. Холден Карау, Матей Захария, Патрик Венделл, Энди Конвински
Объём данных, подлежащих обработке в человеческой деятельности, увеличивается с каждым годом. Как эффективно с ними взаимодействовать?
Apache Spark – это открытая система кластерных вычислений, позволяющая создавать высокопроизводительные программы анализа данных. С её помощью стало возможным управление большими объёмами данных посредством API на Python, Java и Scala.
Авторами книги являются разработчики системы Spark. Они расскажут об организации параллельного выполнения заданий с помощью нескольких строчек кода, также помогут разобраться в системе на примерах.
13. Data Science. Кэти О’Нил, Рэйчел Шатт
Исследование данных – востребованная специализация современного времени. Изучение данных способствует преображению любой традиционной или инновационной бизнес-модели. Книга рассчитана на начинающих специалистов-аналитиков, в ней вы познакомитесь с:
- финансовым моделированием;
- визуализацией данных;
- статистическими алгоритмами;
- байесовским методом;
- рекомендательными движками;
- MaReduce.
0 Комментарии