Лучшие книги по Data Science для начинающих

Отобрали лучшие книги по Data Science для начинающих. Актуальная литература на русском языке для дата саентистов. Научитесь превращать массив данных в структурированную информацию для принятия решений.

ПРИСОЕДИНЯЙТЕСЬ 360 Просмотры

1. Основы Data Science и Big Data. Дэви Силен, Арно Мейсман, Мохамед Али

Image

Data Science – это набор определений и концепций, с помощью которых можно наделить значением и доступным видом большие объёмы данных. Книга рассказывает об одной главной и увлекательной концепции анализа и обработки данных.

Читателя познакомят с теоретической основой, последовательностью машинного обучения, работой с большими массивами данных, NoSQL, детальным анализом текстов и визуальной информацией. В качестве примеров представлены сценарии Data Science на Python.

Обработка и анализ данных – это широко применимая отрасль в IT, именно здесь необходимы талантливые разработчики, способные создавать сценарии разной сложности, от социальных сетей до обучаемых систем. Книга послужит начальной точкой в изучении мира Data Science.

3. Наука о данных. Джон Келлехер, Брендан Тирни

Image

В современном мире наука о данных находит применение во всех областях: рекламные объявления в интернете подбираются под запросы пользователя, рекомендованное высвечивается из-за анализа просмотренных сериалов и прочитанных книг, ссылки в социальных сетях появляются по методу «знакомые», а также отсортированные входящие уходят в отдельную папку со спамом.

Читателя познакомят с базовыми принципами науки о данных. В неё включены основные аспекты, от момента становления сбора и анализа данных, до решения этических конфликтов, нарастающих из-за политики конфиденциальности. Читателю расскажут, как ведут работу нейронные сети и машинное обучение, приведут примеры изучения бизнес-проблем и покажут пути их решения. Дополнительно расскажут о тех областях, на которые наука о данных повлияет в большей степени.

5. Убийственные большие данные. Кэти О’Нил

Image

Математические алгоритмы постепенно захватывают нашу жизнь. Кэти О’Нил – это профессор математики и финансовый аналитик, считающая, что алгоритмы стали серьёзным оружием в руках государства и предприятий – это оружие изначально направлено на нуждающиеся и незащищённые слои населения.

Современные математические приложения, созданные для банков и страховых компаний, способны следить за каждым действием человека в пространстве интернета. Однако они появлялись на основе предрассудков и убеждений, которыми грешат их создатели. Основа и критерии реализации математических алгоритмов подлежат охране и строгому контролю. Добро пожаловать в мир убийственных Больших данных!

7. Практическая статистика для специалистов Data Science. Питер Брюс, Эндрю Брюс

Image

Практический учебник представлен для специалистов в сфере данных, обладающих навыком работы с языком программирования и знакомых с определением математической статистики. Здесь в доступном виде представлены основные моменты из статистики науки о данных, также объясняется, какие критерии необходимы и полезны со стороны анализа данных. Детально рассматриваются предметы:

  • разведочный анализ данных;
  • распределение данных и выборок;
  • статистические эксперименты и проверка значимости;
  • статистическое машинное обучение и обучение без учителя.

9. Data Science. Наука о данных с нуля. Джоэл Грас

Image

Читателя познакомят с миром науки о данных и научат применять знания в практической среде. Легкодоступный способ изложения помогает неопытному, но интересующемуся человеку понять аналитику без возможных сложностей.

Джоэл Грас рассказывает о языке Python, элементах линейной алгебры, математической статистике, методах сбора, нормализации и обработки данных. Дополнительно даёт информационную базу для машинного обучения. Описывает математические модели и пути их разработки по принципу «k».

11. Изучаем Spark. Холден Карау, Матей Захария, Патрик Венделл, Энди Конвински

Image

Объём данных, подлежащих обработке в человеческой деятельности, увеличивается с каждым годом. Как эффективно с ними взаимодействовать?

Apache Spark – это открытая система кластерных вычислений, позволяющая создавать высокопроизводительные программы анализа данных. С её помощью стало возможным управление большими объёмами данных посредством API на Python, Java и Scala.

Авторами книги являются разработчики системы Spark. Они расскажут об организации параллельного выполнения заданий с помощью нескольких строчек кода, также помогут разобраться в системе на примерах.

13. Data Science. Кэти О’Нил, Рэйчел Шатт

Image

Исследование данных – востребованная специализация современного времени. Изучение данных способствует преображению любой традиционной или инновационной бизнес-модели. Книга рассчитана на начинающих специалистов-аналитиков, в ней вы познакомитесь с:

  • финансовым моделированием;
  • визуализацией данных;
  • статистическими алгоритмами;
  • байесовским методом;
  • рекомендательными движками;
  • MaReduce.

15. Big data, дополненная реальность и компьютерное зрение / Интервью с Data Scientist


Ваша реакция?

0
LOL
1
LOVED
0
PURE
0
AW
0
FUNNY
0
BAD!
0
EEW
0
OMG!
0
ANGRY
0 Комментарии

  • Лучшие книги по Data Science для начинающих
  • Николай