中文字幕精品无码一区二区,成全视频在线播放观看方法,大伊人青草狠狠久久,亚洲一区影音先锋色资源

第5課 電子表格數據的統計 課件(共16張PPT) 閩教版(2020)初中信息技術七年級上冊+

資源下載
  1. 二一教育資源

第5課 電子表格數據的統計 課件(共16張PPT) 閩教版(2020)初中信息技術七年級上冊+

資源簡介

(共16張PPT)
通過看電影這個主題,學習如何采集到合適的數據,通過分析這些數據,幫助我們更好地決策。
第5課 電子表格數據的統計
項目:為ta定制一份觀影報告,推薦3部電影
被推薦人:媽媽
推薦電影1:永不消逝的電波
推薦指數:★★★★★
推薦理由:
愛看諜戰片的你絕對不能錯過這部致敬經典之作,更別說演藝形式是你最愛的舞劇,豆瓣評分高達9.4分哦!看看網友最優質的影評和評論的熱詞吧。
“陰森肅穆的舞臺、明暗對比強烈的燈光、節奏緊張的音樂、線條優美的服裝、雙人舞的愛意縫綣、旗袍舞的婀娜多姿、特務的殺氣騰騰,讓人完全挪不開眼……”
被推薦人:好友奇多
推薦電影3:寶蓮燈
推薦指數:★★★★
推薦理由:
國產動畫良心制作,1999年出品,古典傳說+中國畫風+明星聲優+少年冒險故事+流行歌主題曲……基本上各種成功因素都有了。
“媽媽,我長大了!"張信哲的歌一響起,忍不住鼻酸。張信哲的聲音和如此唯美的畫面感覺特別相配,螢火蟲把寶蓮燈點得忽明忽暗的場景讓我永生難忘,太美了……
互聯網公司為你推薦電影
為你推薦
Q:各種視頻平臺如何借助數據,為我們做推薦?
APP推薦電影基本原理
分析用戶
分析電影
偵探迷
演員控
畫面控
二次元
數據類型2:
行為記錄
如觀看內容、
點贊、評論
觀看時長
數據類型1:
基本信息
數據類型2:
日志信息:如點贊量、評論
數據類型1:
基本信息
將用戶標簽與影片標簽用算法匹配后
為用戶進行推薦
本節課目標
了解數據處理與應用的全流程
用影評數據生成一部電影的標簽詞云圖
項目后續3節課
依據ta的喜好,采集幾十部相關電影數據,
篩選出3部最適合電影,完成報告的撰寫
APP推薦電影基本原理
數據處理基本流程
1
2
3
4
數據采集
APP能夠直接獲取到用戶數據,我們需要借助爬蟲采集
數據整理
刪除掉缺失、重復、錯誤的數據
數據分析
提取有價值的信息
數據可視化
選擇適當的方式圖表進行呈現
Q:我們從哪里采集影評數據?
爬蟲是什么?如何用爬蟲采集數據?
網絡爬蟲是什么?
爬蟲就是一段程序代碼,幫助我們自動抓取網頁內容
爬蟲工作的起點叫做種子,其實就是一個網址,程序訪問這個網址,按照設定的規則采集數據。
https://movie.douban.com/subject/26794435/
任務1:數據采集+整理
1)
查看學生文件夾中的
《操作流程》,從豆瓣電影網站里選擇一部電影,打開douban_conment.py修改程序中的電影編碼和電影名稱
2)
修改python代碼,運行后采集短評數據
3)
查看excel文件采集的
評論,刪除掉缺失,重復,
錯誤數據
任務1:數據采集+整理
#使用循環,分次爬取第個頁面的短評數據
for i in range(0,page_count):
#1.組裝短評頁面的網址
url=f'https://movie.douban.com/subject/{douban_id}/comments start={i*20}&limit=20&status=P&sort=new_score'
#2.獲取頁面內容
print(url)
找到種子地址,編寫程序
設定規則進行采集
任務1:數據采集+整理
是否存在缺失,重復,錯
誤數據,完成糾錯?
豆瓣電影這個數據源,采
集到的數據較完整、準確。
任務2:數據分析+可視化
1)依據數據類型進行分析。統計短評數據中
每個詞出現的次數,依據詞頻高低繪制詞云圖。
2)完成任務單,思考現有標簽能否幫助我們了解電
影的特征,存在什么問題,可以如何優化?
項目 內容
姓名
分析的電影名稱
短評詞云圖
現有標簽能夠幫助你了解這部電影 的特征嗎?存在什么問題?
可以從數據采集、整理、分析、可視化中哪些環節解決這些問題?嘗試提出1個解決方案。
豆瓣電影數據統計與分析任務單
分析結果與數據源、數據
有緊密關系。
分享時間
Q:如何通過短評數據得出詞頻?
jieba模塊幫忙完成文本分詞:Python Jieba
[輸入文本]故宮的著名景點包括乾清宮、太和殿和黃琉璃瓦
[精確模式]故宮/的/著名景點/包括/乾清宮/、/太和殿/和/黃/琉璃瓦
任務2:數據分析+可視化
1)依據數據類型進行分析。統計短評數據中
每個詞出現的次數,依據詞頻高低繪制詞云圖。
2)完成任務單,思考現有標簽能否幫助我們了解電
影的特征,存在什么問題,可以如何優化?
項目 內容
姓名
分析的電影名稱
短評詞云圖
現有標簽能夠幫助你了解這部電影 的特征嗎?存在什么問題?
可以從數據采集、整理、分析、可視化中哪些環節解決這些問題?嘗試提出1個解決方案。
豆瓣電影數據統計與分析任務單
分析結果與數據源、數據
有緊密關系。
分享時間
數據處理基本流程
1
2
3
4
數據采集
根據結果增加采集的數據量還可采集長評或其他數據源
數據整理
目前平臺無需清洗
數據分析
分詞時,合并同義詞
按照有用值,給評論賦權重可設定jieba.只提取名詞
數據可視化
形式上要方便用戶提取高頻詞
形成自己的價值判斷
貢獻有價值的信息
謝謝聆聽

展開更多......

收起↑

資源預覽

<pre id="tfb94"><li id="tfb94"></li></pre>

<bdo id="tfb94"><rt id="tfb94"></rt></bdo>
  • <menu id="tfb94"><dl id="tfb94"></dl></menu><i id="tfb94"><acronym id="tfb94"><sub id="tfb94"></sub></acronym></i>

    1. 主站蜘蛛池模板: 邵武市| 育儿| 明光市| 阿坝县| 曲水县| 会泽县| 丰城市| 宝清县| 建宁县| 永兴县| 桐梓县| 法库县| 江阴市| 丰宁| 张掖市| 年辖:市辖区| 淅川县| 静安区| 玉树县| 武平县| 南开区| 五大连池市| 阜新| 松原市| 汝阳县| 林州市| 登封市| 宁化县| 偃师市| 卢湾区| 贵德县| 东莞市| 兴和县| 梁平县| 新晃| 朔州市| 通辽市| 瑞昌市| 汉寿县| 南召县| 昌图县|