GitHunt
GS

GSimonX37/Letterboxd

Разработка программы по сбору и систематизации данных о более 850 тыс. кинофильмов с сайта Letterboxd.com. Анализ данных.

letterboxd

Цель и задачи проекта

Цель проекта: провести анализ данных, размещенных на сайте
letterboxd.com.

Задачи проекта:

  1. Собрать и систематизировать данные,
    размещенные на сайте letterboxd.com.
  2. Предварительно обработать и провести разведочный анализ данных.

Этапы проекта

Название этапа Описание этапа Инструменты
1 Сбор и систематизация данных Написание программы, осуществляющей сбор и систематизацию данных с сайта letterboxd.com. Сбор и систематизация данных.
  • AIOHTTP
  • BeautifulSoup4
2 Разведочный анализ данных Анализ основных свойств данных, выявление распределений, общих зависимостей и аномалий с помощью инструментов визуализации.
  • Jupyter
  • Matplotlib
  • NumPy
  • Pandas
  • Seaborn

Блокноты

  1. exploring.ipynb - предварительная обработка
    и проведение разведочного анализа данных.

Набор данных

Набор данных размещен на сайте
kaggle.com,
последнюю версию набора данных вы можете найти там.

Документация

  1. Начало работы.
  2. Структура проекта.
  3. Описание данных.
  4. Получение данных.

Лицензия

Распространяется по лицензии GNU General Public License v3.0.
См. LICENSE для получения дополнительной информации.

Languages

Jupyter Notebook99.4%Python0.6%

Contributors

GNU General Public License v3.0
Created March 10, 2024
Updated July 1, 2024
GSimonX37/Letterboxd | GitHunt