博客
关于我
电影评价数据的采集
阅读量:282 次
发布时间:2019-03-01

本文共 406 字,大约阅读时间需要 1 分钟。

阿里云大学课程:网络爬虫与数据采集实践

课程概述电影评价网站记录着观影者对电影的喜好程度和评价信息,通过对相关网站用户评价信息的收集,可以为电影相关的数据分析和挖掘做支撑。本课程将带领学员深入了解网络爬取的基本原理、工具使用方法以及数据采集与存储的完整流程。

课程目标掌握网络内容爬取的基本流程、解析方法和工具使用能力,熟练掌握数据采集和数据存储的过程。

课程亮点本课程采用阿里云大学独家开发的项目式学习模式,结合真实案例进行网络爬虫的实践操作。课程内容涵盖从爬虫策略制定到实际项目实施的全生命周期管理,学生将通过完成基于电影评价数据的采集项目,掌握从零到一的数据采集实践经验,方便推广至其他评价信息采集场景。

课程结构

  • 数据采集概述
  • 网络爬虫概述
  • 爬虫数据结构解析
  • 爬虫策略设计
  • 爬虫实现实践
  • ECS产品介绍
  • ECS购买操作指南
  • 项目概览
  • 项目实施方案
  • 在线实验:基于电影评价数据的采集
  • 课程开始阿里云大学首页

    转载地址:http://gluo.baihongyu.com/

    你可能感兴趣的文章
    Netty工作笔记0020---Selectionkey在NIO体系
    查看>>
    Vue踩坑笔记 - 关于vue静态资源引入的问题
    查看>>
    Netty工作笔记0025---SocketChannel API
    查看>>
    Netty工作笔记0027---NIO 网络编程应用--群聊系统2--服务器编写2
    查看>>
    Netty工作笔记0050---Netty核心模块1
    查看>>
    Netty工作笔记0057---Netty群聊系统服务端
    查看>>
    Netty工作笔记0060---Tcp长连接和短连接_Http长连接和短连接_UDP长连接和短连接
    查看>>
    Netty工作笔记0063---WebSocket长连接开发2
    查看>>
    Netty工作笔记0070---Protobuf使用案例Codec使用
    查看>>
    Netty工作笔记0077---handler链调用机制实例4
    查看>>
    Netty工作笔记0084---通过自定义协议解决粘包拆包问题2
    查看>>
    Netty工作笔记0085---TCP粘包拆包内容梳理
    查看>>
    Netty常用组件一
    查看>>
    Netty常见组件二
    查看>>
    netty底层源码探究:启动流程;EventLoop中的selector、线程、任务队列;监听处理accept、read事件流程;
    查看>>
    Netty心跳检测机制
    查看>>
    Netty核心模块组件
    查看>>
    Netty框架内的宝藏:ByteBuf
    查看>>
    Netty框架的服务端开发中创建EventLoopGroup对象时线程数量源码解析
    查看>>
    Netty源码—2.Reactor线程模型一
    查看>>