加入RUN!PC粉絲團
最近新增的精選文章
 
最多人點閱的精選文章
 
 
精選文章 - 商務應用
分享到Plurk
分享到FaceBook
 
R語言:開放性資料分析工具水漲船高
文/林裕洋 2014/5/20 上午 10:44:26

一套開放性的資料分析工具,採用指令操作,特別適用於高複雜度,高彈性需求的情況,在學術單位使用較為廣泛。亦有商業版本如Revolution Analytics推出的REvolution R。

在各大資訊廠商不斷推出Big Data解決方案之後,不少資訊長也開始關注統計分析軟體的發展,多數人最熟悉的莫過於從學生時代開始接觸的SPSS、SAS等商用軟體。商用軟體的價格向來不親民,尤其應用於大量資料分析時,授權費用勢必會更驚人,因此原本應用於工程資料分析領域的R語言,逐漸被企業用戶關注,開始學習相關操作與模型設計技巧的人也愈來愈多。

R語言處於開放原始碼的自由軟體,主要用於統計分析、繪圖、資料探勘等領域,由Ross Ihaka和Robert Gentleman博士合力開發而成,現在如同其他免費軟體一樣,改由R基金會負責開發。R語言是基於S語言(商用分析軟體)延伸出來的GNU計劃專案,因為S語言是由貝爾實驗室開發出來的統計軟體,使用上難免會牽扯到授權問題,而用S語言編寫代碼或資料分析模型,都可以在R語言環境下直接執行。

R語言可免費下載 入門難度較高
在GNU規範下,R語言的原始碼可自由下載使用,亦有人發佈已編譯的執行檔版本,並且支援多種作業平台,如UNIX、FreeBSD、Linux、Windows和MacOS等等,有興趣的讀者可以連上www.r-project.org查詢相關資料。值得一提之處,在R語言如同早期Linux系統,主要是以命令列操作,不過也有開發人員貢獻多種圖形用戶介面,可降低初次操作上的難度。

由於R語言是專門為統計分析設計,軟體本身已經事先內建多種統計與數字分析工具,另外也可以透過安裝套件增加其他功能,如統計技術、繪圖功能,以及編程介面和資料輸出/輸入功能等等。另外,網路上也有不少人公布已經建立好的分析模式,常見模型主要以經濟計量、財經分析、人文科學研究以及人工智慧等為主。此外,生物資訊學也常使用R語言進行分子生物學資料分析,以知名的Bioconductor計劃為例,便是以R語言作為基因圖譜分析工具。

可處理TB級資料 跨入Big Data最佳選擇
R語言會被廣泛使用在經濟、財經、生物分析領域中,關鍵在於軟體擁有處理大量資料的能力,加上不需要支付授權費用,自然往往成為許多研究人員的最愛。但畢竟R語言是以命令列式操作環境,若對工具本身不熟悉,在使用上勢必會遭遇許多困難,市面上也有軟體公司提供整合過後的版本。RevolutionAnalytics便是在符合GNU的授權條款下,將 R語言重新編譯之後,推出商用版的Revolution R,企業用戶只需要支付一定的技術服務費,即可可取得具有多核運算以及平行處理等功能的版本,非常符合商業環境下使用。

而R語言只要搭配適合的硬體設備,便具備處理TB級資料的能力,非常適合在雲端與行動裝置盛行的環境下使用。因此,若企業有熟悉該語言的人才,或願意規劃相關培訓計畫,R語言或許會是企業跨入Big Data領域的最佳選擇。



官網:www.r-project.org

近日新聞:
—2013/05/16 Tibco提供免費版本給R語言開發人員在非生產環境中使用
(http://goo.gl/Y9kkWk)
—2013/12/16 軟體商為巨量資料分析需求整合Hadoop與R語言
(http://goo.gl/axAJOl)
—2014/02/10 AWS提供隨需提供的的R語言服務
(http://goo.gl/Id5fTV)