Книга "Скрапинг веб-сайтов с помощью Python" (Р.Митчелл)
Изучите методы скрапинга и краулинга веб-сайтов, чтобы получить доступ к неограниченному объему данных в любом уголке Интернета в любом формате. С помощью этого практического руководства вы узнаете, как использовать скрипты Python и веб-API, чтобы одновременно собрать и обработать данные с тысяч или даже миллионов веб-страниц.
Идеально подходящая для программистов, специалистов по безопасности и веб-администраторов, знакомых с языком Python, книга знакомит не только с основными принципами работы веб-скраперов, но и углубляется в более сложные темы, такие, как анализ сырых данных или использование скраперов для тестирования интерфейса веб-сайта. Примеры программного кода, приведенные в книге, помогут разобраться в этих принципах на практике.
Прочитав эту книгу, вы научитесь:
- выполнять парсинг сложных HTML страниц;
- сканировать веб-страницы и сайты;
- работать с API;
- применять несколько методов хранения собранных данных;
- скачивать, обрабатывать и извлекать данные из документов;
- использовать инструменты и методы для очистки плохо отформатированных данных;
- читать и записывать естественные языки;
- выполнять краулинг с использованием регистрационных форм;
- выполнять скрапинг Javascript-кода;
- обрабатывать изображения и распознавать текст.
Инструменты и примеры, приведенные в этой книге, позволяют легко автоматизировать несколько повторяющихся задач, высвобождая время для решения более насущных проблем. Это легко читаемая, ориентированная на конкретный результат книга, рассказывающая о реальных проблемах и решениях. Здесь можно скачать файлы к книге.
1 | Краткое наименование | Книга "Скрапинг веб-сайтов с помощью Python" (Р.Митчелл) |
---|---|---|
2 | Вес | 0.29 кг |
3 | Описание | Изучите методы скрапинга и краулинга веб-сайтов, чтобы получить доступ к неограниченному объему данных в любом уголке Интернета в любом формате. С помощью этого практического руководства вы узнаете, как использовать скрипты Python и веб-API, чтобы одновременно собрать и обработать данные с тысяч или даже миллионов веб-страниц. Идеально подходящая для программистов, специалистов по безопасности и веб-администраторов, знакомых с языком Python, книга знакомит не только с основными принципами работы веб-скраперов, но и углубляется в более сложные темы, такие, как анализ сырых данных или использование скраперов для тестирования интерфейса веб-сайта. Примеры программного кода, приведенные в книге, помогут разобраться в этих принципах на практике. Прочитав эту книгу, вы научитесь: - выполнять парсинг сложных HTML страниц; - сканировать веб-страницы и сайты; - работать с API; - применять несколько методов хранения собранных данных; - скачивать, обрабатывать и извлекать данные из документов; - использовать инструменты и методы для очистки плохо отформатированных данных; - читать и записывать естественные языки; - выполнять краулинг с использованием регистрационных форм; - выполнять скрапинг Javascript-кода; - обрабатывать изображения и распознавать текст. Инструменты и примеры, приведенные в этой книге, позволяют легко автоматизировать несколько повторяющихся задач, высвобождая время для решения более насущных проблем. Это легко читаемая, ориентированная на конкретный результат книга, рассказывающая о реальных проблемах и решениях. Здесь можно скачать файлы к книге. |
4 | Размеры упаковки (измерено в НИКСе) | 20.32 x 13.99 x 1.47 см |
5 | Вес брутто (измерено в НИКСе) | 0.297 кг |
6 | Автор | Р.Митчелл |
7 | Серия | Бестселлеры O'Reilly, Языки программирования, Программирование поисковых роботов (скрапер, краулер), Парсинг, регулярные выражения, Распознавание текста |
8 | Название | Скрапинг веб-сайтов с помощью Python |
9 | ISBN | 978-5-97060-223-2 |
10 | Формат книги | 148 x 210 мм |
11 | Количество страниц | 272 |
12 | Год издания | 2016 |
13 | Обложка | Мягкая обложка |
14 | Издательство | ДМК Пресс |
15 | Рекомендуемый возраст | 12+ |
Xарактеристики, комплект поставки и внешний вид данного товара могут отличаться от указанных или могут быть изменены производителем без отражения в каталоге.
Производитель/Адрес: Планет Технолоджи Корпорейшн. 11Ф., Не 96МетроМинqуан РД., К Синьдянь Н., Новый Тайбэй 231, Тайвань (Р. О. Ц)С. АОС Интернешнл (Европ) БВ, Барбара Строззилан 386 НЛ-1083 Амстердам, НидерландыAOC International (Europe) BV, Barbara Strozzilaan 386 NL-1083 HN Amsterdam The Netherlands Страна производства: Китай Импортер: ООО Гигамаркет г.Минск, ул. Грибоедова 1-191