Skip to Content Facebook Feature Image

21世紀必懂的最強趨勢:數據科學

博客文章

21世紀必懂的最強趨勢:數據科學
博客文章

博客文章

21世紀必懂的最強趨勢:數據科學

2021年08月14日 14:31 最後更新:14:31

隨著數據科學的應用越來越普遍,各大行業都開始向相關領域的人才拋出橄欖枝。到底數據科學是什麼?發展前景如何?從零開始學起又需要多久時間?不如就讓 Preface 逐一解答你的問題吧!

 

什麼是數據科學?

 

「數據科學」其實是一個統稱,涵蓋統計、人工智能 (AI)、數據分析、數據抽取等多個流程。

 

在《Doing Data Science》一書中,作者就著數據科學家的工作內容,給出了一個簡易易懂的總結:

 

「數據科學家是懂得如何使用不同工具和方法,從數據中提取知識和理解的人。」

 

而如果需要從大量數據中發掘有意義的資訊,便必須掌握數據科學的 5 大工作階段:

 

5 大工作階段

1. 提取

  • 數據採集
  • 數據輸入
  • 信號接收
  • 數據收錄

2. 維護

  • 數據倉庫
  • 數據清理
  • 數據暫存
  • 數據處理
  • 數據架構

3. 處理

  • 數據挖掘
  • 聚類
  • 數據建模
  • 數據匯總

4. 分析

  • 探索和確認
  • 預測分析
  • 定性分析

5. 溝通

  • 數據報告
  • 數據可視化
  • 提出建議

5 大工作階段

1. 提取

  • 數據採集
  • 數據輸入
  • 信號接收
  • 數據收錄

2. 維護

  • 數據倉庫
  • 數據清理
  • 數據暫存
  • 數據處理
  • 數據架構

3. 處理

  • 數據挖掘
  • 聚類
  • 數據建模
  • 數據匯總

4. 分析

  • 探索和確認
  • 預測分析
  • 定性分析

5. 溝通

  • 數據報告
  • 數據可視化
  • 提出建議

 

Source: Oracle, Berkeley School of Information

 

為何數據科學這麼受重視?

 

你可能會質疑數據科學是否被過譽了,這真的是 21 世紀最重要的工作之一嗎?

 

沒錯,其發展潛力是巨大的 —— 相信這對酷愛數字的人士而言是一個大好消息。

 

首先,在電子商貿發展千里的現今社會,數據的重要性毋庸置疑。不論是醫療保健、銀行、咨詢服務還是餐飲服務,不同行業都需要一名專家協助公司理解繁瑣的數據並制定更有效的營銷計劃。透過從網站、社交媒體平台和電子支付交易中提取數據,數據科學家可以得悉消費者的消費習慣和模式,從而讓決策者知道該如何為公司的發展做出更明智的決定。

 

除此以外,數據還可以幫助企業洞悉內部不足,讓公司能糾正錯誤,提高效率和生產力。很多時候,企業都會「用錯力」,導致付出和結果不成正比。麻煩的是,搞清楚問題的癥結並不是一件容易的事情。在這個情況下,數據科學便能大派用場!數據科學家可以藉著搜集過往的數據,準確地揭示問題表後的成因,再針對性地提供具體的評估和實時報告,緊密追蹤改善進度,這對於任何企業的成功都至關緊要。

 

Source: AnalytiXLabs, Grow

 

數據科學的相關工作

 

老實說,但凡是有基本的數據科學知識,在所有行業 (不局限於科技) 中都十分搶手。以下是一些最常見的職位:

 

  1. 數據科學家

 

不用多說,數據科學家當然是最相關的職位。工作內容包括從多個資源中抽取數據,再以不同角度進行篩選和分析,從而制定出以數據為基礎的解決方法。就職者需要高水平的電腦技術,例如熟悉編碼語言、數據庫、機器學習和數據報告技巧。最典型的僱主分別來自高等教育、銀行、營銷和零售領域。

 

  1. 商業智慧開發人員

 

這個職務的工作範疇包括與最終用戶合作構建報告系統、為未來的決策提供參考等。由於過程中需要用到數據倉庫,所以申請者必須熟悉如何使用檢索和管理工具來提取數據,並在必要時解決數據質量及數據協調的問題。通常大型企業和科技公司會較熱衷於聘請這方面的人才。

 

  1. 機器學習工程師

 

由於這份工作的職責包括設計和開發機器學習模型,所以對數據科學和編程知識的要求十分高,亦建議有一定的統計和軟件工程經驗。開發過程通常會從研究數據科學原型開始,然後根據客戶需求,選擇合適的數據集及表達方法。隨著機器學習成為當今的熱門話題,幾乎所有行業都刊登了相關空缺。

 

Source: Target Jobs, Industry Connect, Springboard

 

香港有數據科學的課程嗎?

 

如果你對數據科學沒有任何認識,那以下這個兼職課堂一定很適合你!

 

Preface 提供了一個以 Python 學習數據科學及人工智能 的課程,在短短 80 小時內,學生便能學懂如何使用 Python 編寫代碼並處理大數據集、有條理地分析和收集數據、創建數據框架進行基本分析等。此外,你還可以接觸如何以清晰及引人矚目的方式呈現數據。你還能學到實用的機器學習技術,有助將來進行預測並提供有異議的見解。

 

由於課程設計是建基於現實生活中的案例和商業應用,學生能夠從最貼近現實的場景快速掌握不同編程技術。最重要的是,學生永遠都不需要辭職或捨棄其它活動,Preface 會讓學生自由安排課程進度,既可以選擇單獨上課,亦可以和志同道合的同學一起學習,無論是哪個選項,都會有專業的導師從旁指導,確保能最大限度地提高每一位學生的學習成果。

 

為何數據科學需要用到 Python 和 R?

 

Python 和 R 都是開源語言,非常適合用於處理數據科學的工作。

 

一般而言,Python 是一種通用語言,當程序員想深入研究某組數據或進行統計技術時便會使用;R 則多數用於探索性數據分析,在學術、金融、製藥、媒體和營銷等範疇較為常見。

 

Source: IBM

 

數據科學 VS 人工智能 VS 機器學習

 

數據科學

人工智能

機器學習

定義

操作各種數據

包括機器學習

屬於人工智能的一部分

用途

處理複雜的數據,並從中提煉見解

讓計算機模仿人類的行為和思維方式,從而解決複雜的問題

通過學習過往的數據模式,預測或歸類將來的數據

原理

結構和非結構化數據

邏輯和決策樹

統計模式

應用

  • 欺詐識別系統
  • 醫療系統

  • 聊天機器人
  • 語音助手

  • 推薦系統如 Spotify
  • 面部識別

數據科學

人工智能

機器學習

定義

操作各種數據

包括機器學習

屬於人工智能的一部分

用途

處理複雜的數據,並從中提煉見解

讓計算機模仿人類的行為和思維方式,從而解決複雜的問題

通過學習過往的數據模式,預測或歸類將來的數據

原理

結構和非結構化數據

邏輯和決策樹

統計模式

應用

  • 欺詐識別系統
  • 醫療系統

  • 聊天機器人
  • 語音助手

  • 推薦系統如 Spotify
  • 面部識別

 

Source: My Great Learning

 

數據科學家、數據分析師和數據工程師: 職責、要求和薪酬

 

 

數據科學家

數據分析師

數據工程師

職級

較高級

較入門

科學家和分析師的中間

職責

開發可操作的業務洞察力

將數字數據翻譯成每個人都能理解的形式

準備數據作分析或操作用途

要求

具備深入的機器學習、統計和數據處理方面知識

精通編程語言、分析工具、數據處理、報告和建模的基礎知識

有數據架構的構建、開發和維護經驗

薪酬

~ $790,000 HKD

~ $380,000 HKD

~ $670,000 HKD

數據科學家

數據分析師

數據工程師

職級

較高級

較入門

科學家和分析師的中間

職責

開發可操作的業務洞察力

將數字數據翻譯成每個人都能理解的形式

準備數據作分析或操作用途

要求

具備深入的機器學習、統計和數據處理方面知識

精通編程語言、分析工具、數據處理、報告和建模的基礎知識

有數據架構的構建、開發和維護經驗

薪酬

~ $790,000 HKD

~ $380,000 HKD

~ $670,000 HKD

 

Source: Simplilearn, Glassdoor

 

文章出處:https://www.preface.ai/blog/others/data-science/




amychan2264

** 博客文章文責自負,不代表本公司立場 **

往下看更多文章

Coding課程點揀好?

 

Coding 即編程,人類透過編寫程式將指令翻譯成機器能理解的語言,從而和電腦取得交流。過去,學習編程一直被視為書呆子的活動,怎料近年卻突然成了大趨勢,不少家長都爭相為子女報讀相關課程。不過,你真的清楚編程能為孩子帶來什麼好處嗎?

 

啟發創意

隨著科技進步,表達自我的方法不再侷限於繪畫和寫作,孩子能充分運用編程來展現自己獨特的一面。研究發現,歐洲國家研發多達 300 萬個應用程式,YouTube 上更有超過 8 億個影片。在設計應用程式的過程中,小朋友需要發揮創意,既鍛鍊了擴散性思考又強化了聚斂性思考能力,大大促進腦部發展。

 

訓練解難能力

自呱呱落地的一剎那,小朋友便正式開始接觸這個多姿多彩的世界。他們可能會好奇萬物的原理。而生活在數碼世代,學習編程可以讓你的孩子對周遭事物有更進一步的理解。編程有助孩子學會欣賞不同的發明,並明白軟件工程師如何善用邏輯及推理思維,解決種種現實問題。編程還可以讓孩子敢於面對及克服眼前的困難。簡而言之,這是一項必要技能。

 

強化邏輯思維

編程並不止步於創建遊戲和網站,在這之上,它還能提高孩子的邏輯思維能力。如果想有效率地編寫程式,孩子必須學習如何將複雜的問題分解成不同部分,再按部就班地逐一解決。從計劃、分拆、測試到調試,孩子的運算思維都會得到充分鍛鍊。

 

學習編程,越早越好

除了硬知識的增長,編程對孩子的全人發展還有很多好處。但到底孩子應該幾歲開始學編程呢?如果你希望孩子有全面的發展,你就應該及早帶領孩子認識科技領域,準備好面對未來的關鍵能力。從小學開始,孩子就可以開始學習編程。

 

即使是學前班的孩子,也有相應的課程教導他們如何編程。市面上有林林總總的資源,讓任何年齡層的孩子都能開始學習,比如一些教導 3 歲孩子關於編程基本概念的教材。如果還不知道該如何踏出第一步,不妨參考下列建議!

 

小朋友可以如何開始學習編程?

其實早在幼稚園,小朋友便能開始學習編程。針對 3 至 5 歲的幼兒,ScratchJr 的介面非常清晰簡單,讓未能認字的孩子也能拖拽螢幕上的方塊,並在過程中掌握基本的編程概念。而 6 歲或以上的孩子,則可以使用有更多功能的 Scratch,在平台上創建自己的遊戲和應用程式。

 

如果孩子年滿 9 歲或以上,建議開始學習如 App Inventor 的程式語言。App Inventor 是一個由麻省理工學院 (MIT) 開發的教育平台,讓小朋友能從零建立一個功能齊全的手機及電腦應用程式。這個平台還能讓孩子們進一步掌握有關程式設計和結構的知識,有助他們將來學習更複雜的文本編程語言如 JavaScript。

 

兒童編程學習班推薦

 

ScratchJR/ Scratch 

因應 3 至 5 歲孩童的學習能力,有些編程學校會提供 ScratchJR 課程。課堂上會善用動感畫面和可愛卡通引發孩子的學習動機,小朋友還可以親自創造自己的卡通人物,讓它們按自己的指令移動,奠定編程基礎。至於 6 至 8 歲的孩子,則建議報讀 Scratch 課程。老師會指導學生逐步建立有趣的動畫或遊戲,讓他們在不知不覺間學懂基本的編程邏輯和語法。

 

App Inventor 

9 歲或以上的孩子可以考慮 App Inventor 課程。學生不但能學懂如何運用編程邏輯,建立一個有聲音、畫面、動畫的應用程式,導師 還會教授怎樣用直觀的方式編寫一個真的能在 App Store 上架的遊戲、功能 (Functional) 甚至是音樂應用程式!

 

進階班

掌握了基本的編程技巧之後,有能力的小朋友也可以嘗試挑戰近年非常流行的網頁開發Python 課程。