【从0带做】手把手轻松爬取电影网站【万】部电影数据 适合爬虫入门 爬虫原理java爬虫数据量超万条 豆瓣电影爬虫 Springboot Jsoup
包含内容: 源码,数据库,论文
作者QQ1420527913

【项目包含】

【视频教程】

【项目功能】以及 【项目包含内容】见上面的视频
技术栈: Springboot Mysql Jsoup
1. 电影信息的分析
https://movie.douban.com/subject/26745332
电影的名称 (花月杀手 Killers of the Flower Moon)
电影的上映日期 (2023)
电影的导演 (马丁·斯科塞斯)
电影的主演 ( 莱昂纳多·迪卡普里奥 / 罗伯特·德尼)
电影的类型 (剧情 / 爱情 / 悬疑 / 历史 / 犯罪 / 西部)
制片国家/地区 (美国)
电影片长 (206分钟)
电影评分 (7.3)
电影的评论数量 (42470)
电影的简介 (.......)
电影的封面 ()
2. 数据库的创建
创建数据库 movie
创建数据表 movie_spider
CREATE TABLE `movie_spider` (
`movie_id` int(10) unsigned NOT NULL AUTO_INCREMENT COMMENT '主键',
`movie_subject` varchar(20) CHARACTER SET utf8mb4 COLLATE utf8mb4_bin DEFAULT NULL COMMENT '电影编号',
`movie_name` varchar(200) CHARACTER SET utf8mb4 COLLATE utf8mb4_bin DEFAULT NULL COMMENT '电影名称',
`movie_country` varchar(100) CHARACTER SET utf8mb4 COLLATE utf8mb4_bin DEFAULT NULL COMMENT '国家',
`movie_year` varchar(5) CHARACTER SET utf8mb4 COLLATE utf8mb4_bin DEFAULT NULL COMMENT '上映年份',
`movie_type` varchar(50) CHARACTER SET utf8mb4 COLLATE utf8mb4_bin DEFAULT NULL COMMENT '电影类型',
`movie_director` varchar(200) CHARACTER SET utf8mb4 COLLATE utf8mb4_bin DEFAULT NULL COMMENT '导演',
`movie_cast` varchar(1000) CHARACTER SET utf8mb4 COLLATE utf8mb4_bin DEFAULT NULL COMMENT '演员',
`movie_star` varchar(5) COLLATE utf8mb4_bin DEFAULT NULL COMMENT '评分',
`movie_comments` varchar(1000) CHARACTER SET utf8mb4 COLLATE utf8mb4_bin DEFAULT NULL COMMENT '电影评论数量',
`movie_duration` int(3) DEFAULT NULL COMMENT '时长(分钟)',
`movie_img` varchar(500) CHARACTER SET utf8mb4 COLLATE utf8mb4_bin DEFAULT NULL COMMENT '封面',
`movie_introduce` varchar(5000) CHARACTER SET utf8mb4 COLLATE utf8mb4_bin DEFAULT NULL COMMENT '电影评论数',
PRIMARY KEY (`movie_id`),
UNIQUE KEY `MovieSubject` (`movie_subject`)
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_bin