Translate

顯示具有 105-1 東海資管 - 大數據分析實務 標籤的文章。 顯示所有文章
顯示具有 105-1 東海資管 - 大數據分析實務 標籤的文章。 顯示所有文章

2016年10月17日 星期一

105-1 東海資管 - 大數據分析實務 - Data Journalism 個案收集


Dear 各位同學

請完成Data Journalism 的個案調查與介紹,
並思考自己想要製作的Data 故事!

繳交時間:10/31

參考資料:



繳交格式:

學號:
姓名:
  • 個案1 名稱 :
  • 個案1 網址 :
  • 個案1 喜歡的原因 :
  • 個案1 使用資料集
  • 資料集1名稱:
  • 資料集1源:
  • 資料集1網址
  • 資料集2名稱:
  • 資料集2源:
  • 資料集2網址
  • ..... 
  • 個案2 名稱 :
  • 個案2 網址 :
  • 個案2 喜歡的原因 :
  • 個案2 使用資料集
  • 資料集1名稱:
  • 資料集1源:
  • 資料集1網址 
  • 資料集2名稱: 
  • 資料集2源:
  • 資料集2網址
  • 個案3 名稱 :
  • 個案3 網址 :
  • 個案3 喜歡的原因 :
  • 個案3 使用資料集
  • 資料集1名稱:
  • 資料集1源:
  • 資料集1網址
  • 資料集2名稱:
  • 資料集2源:
  • 資料集2網址

個人Data Journalism 設計
  • 主題 :
  • 資料來源:
  • 介紹:

學號:
姓名:

  • 個案1 名稱 :
  • 個案1 網址 :
  • 個案1 喜歡的原因 :
  • 個案1 使用資料集
  • 資料集1名稱:
  • 資料集1源:
  • 資料集1網址
  • 資料集2名稱:
  • 資料集2源:
  • 資料集2網址
  • ..... 
  • 個案2 名稱 :
  • 個案2 網址 :
  • 個案2 喜歡的原因 :
  • 個案2 使用資料集
  • 資料集1名稱:
  • 資料集1源:
  • 資料集1網址 
  • 資料集2名稱: 
  • 資料集2源:
  • 資料集2網址 
  •   .....
  • 個案3 名稱 :
  • 個案3 網址 :
  • 個案3 喜歡的原因 :
  • 個案3 使用資料集
  • 資料集1名稱:
  • 資料集1源:
  • 資料集1網址
  • 資料集2名稱:
  • 資料集2源:
  • 資料集2網址 
  •  .....

個人Data Journalism 設計
  • 主題 :
  • 資料來源:
  • 介紹:

105-1 東海資管 - 大數據分析實務 - MySQL Load data from File





Lload data local infile FILE_PATH into table TABLE_NAME fields TERMINATED by ','  lines TERMINATED by '\r';

 Example:

  •  load data local infile '/home/pan/pet2_dot.txt' into table pets2 fields TERMINATED by ','  lines TERMINATED by '\r';

2016年10月3日 星期一

05-1 東海資管 - 大數據分析實務 - 10.03~10.17 作業與練習



各位同學

兩週時間寶貴,請別忘了要複習與思考專題方向,
幾個重點如下:


  1. 專題文件製作,請使用google docs建立一個小組的專題報告文件,並把範例的內容貼入你們小組的文件中,並依照格式編輯 (灰色字體的部分這次還不用編輯)。
  2. 複習課程內容,教材資料已經上傳,於表格中可以找到下載網址
  3. Java程式語言預習,電子書下載:
    • https://www.javaworld.com.tw/jute/post/view?bid=22&id=295899
    • http://www.importnew.com/4578.html
  4. 多逛逛Open Data ( http://data.gov.tw/ ),尋找有趣的資料集
    • 每組請提供一個文件
    • 組員每個人提供三個資料集,並說明為什麼選擇這個資料集
    • 資料集最少要有 csv 格式
    • 下次上課會請每組一位同學介紹自己挑選的資料集

105-1 東海資管 - 大數據分析實務 - JAVA 應用練習


Java 環境安裝下載






字串應用
  • String
  • StringBuffer

檔案應用
  • BufferedReader
  • FileReader
  • IOException

MySQL 應用

  • MySQL Connector Library - Link
  • DriverManager
    • getConnection()
  • Connection
    • createStatement()
  • Statement
    • executeQuery()
  • ResultSet
    • getMetaData()
    • next()
    • getObject()
  • ResultSetMetaData
    • getColumnCount()
    • getColumnName()

2016年9月26日 星期一

105-1 東海資管 - 大數據分析實務 - 作業:數據應用調查與Open Data使用



請各位同學完成以下事項::
  1. 尋找數據分析應用中文個案
  2. 尋找數據分析應用英文個案
  3. 了解中文個案所使用的Open Data 為何
  4. 將Open Data 的格式建立在資料庫中
  5. 將Open Data 的CSV檔案,匯入到資料庫中

繳交資料格式,請在雲端文件中撰寫,並貼入雲端文件:


105-1 東海資管 - 大數據分析實務
2016.09.26 作業 : 數據應用調查與Open Data使用


學號:
姓名
  • 中文個案名稱 :
  • 中文個案網址 :
  • 英文個案名稱 :
  • 英文個案網址 :
  • Open Data 資料名稱 :
  • Open Data 資料網址 :
  • Open Data MySQL Database Name :
  • Open Data MySQL Table Name :



學號:
姓名
  • 中文個案名稱 :
  • 中文個案網址 :
  • 英文個案名稱 :
  • 英文個案網址 :
  • Open Data 資料名稱 :
  • Open Data 資料網址 :
  • Open Data MySQL Database Name :
  • Open Data MySQL Table Name :

105-1 東海資管 - 大數據分析實務 - SSH 登入, MySQL




SSH 軟體下載




MySQL 使用教材 -

  • Download MySQL Slide : Link




2016年9月18日 星期日

105-1 東海資管 - 大數據分析實務 - 虛擬化服務安裝與Linux 安裝練習



虛擬化套件安裝練習

  1. VMware Workstation - http://www.vmware.com/products/workstation.html
  2. VirtualBox - https://www.virtualbox.org/



Source : https://software.intel.com/en-us/articles/the-advantages-of-using-virtualization-technology-in-the-enterprise


Linux 安裝練習








105-1 東海資管 - 大數據分析實務 - 課程介紹



105-1 東海資管 - 大數據分析實務 - 課程介紹

■  課程目標及內涵 (Course Objectives and Contents)
本課程目標是讓學生能夠了解大數據相關技術與議題,包含大數據計算環境建置、雲端計算架構與服務建置、大數據資料倉儲到資料分析技術。透過一系列的大數據應用實例探討、模擬並進行小組專題製作,藉以加強學生在大數據時代的實作能力,讓學生實際接觸大數據應用。

■  多元教學方式 (Muliti-Teaching Methods)
說明:除了課堂講授與考試測驗之外,本課程在學期中可能會運用到以下哪些教學方式,以期能進一步提升學生學習成效
1.小組討論
2.專題研究或實習
3.實作示範或演示
4.期末報告/策展/發表
5.配合專業軟體的使用與教學
6.配合使用數位教學平台(Moodle)或其他多媒體教學

■  主要參考書籍/資料 (Textbooks and References)
1. O'Neil, Cathy,Schutt, Rachel,Doing data science :Sebastopol, CAO'Reilly,2014.
2. Lam, Chuck.Hadoop in action /Greenwich, Conn. :Manning Publicationsc, 2011.
3. Capriolo, Edward.Rutherglen, Jason.Wampler, Dean.Programming Hive /1st ed.Sebastopol, CA :O'Reilly & Associates, 2012.



課程進度規劃:

1 105/09/11 ~ 105/09/17 大數據科學介紹
2 105/09/18 ~ 105/09/24 大數據分析產業個案分析
3 105/09/25 ~ 105/10/01 大數據環境架構介紹 – 大數據型態與對應技術
4 105/10/02 ~ 105/10/08 大數據環境架構介紹 – 分散式儲存/計算架構
5 105/10/09 ~ 105/10/15 大數據環境架構介紹 – 虛擬化技術與大數據平台
6 105/10/16 ~ 105/10/22 大數據環境建置 – Hadoop 平台建構
7 105/10/23 ~ 105/10/29 大數據環境建置 – 系統操作與存取測試
8 105/10/30 ~ 105/11/05 大數據前瞻應用個案報告
9 105/11/06 ~ 105/11/12 大數據前瞻應用個案報告
10 105/11/13 ~ 105/11/19 大數據環境操作 Hadoop Distributed File System
11 105/11/20 ~ 105/11/26 大數據資料倉儲應用介紹及環境建置
12 105/11/27 ~ 105/12/03 大數據資料倉儲應用介紹及環境建置
13 105/12/04 ~ 105/12/10 大數據分析技術簡介
14 105/12/11 ~ 105/12/17 大數據分析技術簡介
15 105/12/18 ~ 105/12/24 大數據分析技術簡介
16 105/12/25 ~ 105/12/31 期末論文報告
17 106/01/01 ~ 106/01/07 期末專題發表
18 106/01/08 ~ 106/01/14 期末專題發表


成績
1 平時成績(出席、參與及作業) 40%
2 期末論文報告/專題發表 60%


專題分組:
https://docs.google.com/spreadsheets/d/1AH19GhM7evcy-kAMf72J5gVZAZMBQROTuEBer6iWAQ4/edit?usp=sharing