真人一对一直播,chinese极品人妻videos,青草社区,亚洲影院丰满少妇中文字幕无码

0
首頁 精品范文 數據分析的前景

數據分析的前景

時間:2023-05-29 18:25:36

開篇:寫作不僅是一種記錄,更是一種創造,它讓我們能夠捕捉那些稍縱即逝的靈感,將它們永久地定格在紙上。下面是小編精心整理的12篇數據分析的前景,希望這些內容能成為您創作過程中的良師益友,陪伴您不斷探索和進步。

第1篇

隨著數據的爆炸式增長,“大數據”一詞受到了越來越多的關注,很多領域已經開始應用大數據。大數據技術不僅能應用于數字出版中,在傳統的紙質出版中也有應用前景。本文擬以醫學出版為例,探討大數據時代下,醫學出版選題策劃的思路轉變,以及面臨的問題與挑戰。

一、大數據時代素描

“大數據”是人們給信息爆炸所產生的巨量數據起的一個簡單的名字。一方面,這些數據蘊藏著巨大的潛在價值,人們迫切需要更先進的技術,對其進行實時處理;另一方面,技術的進步,包括云計算、分布式計算等方法的應用,極大地提升了信息處理能力,提供了廣闊的研究空間,使大數據分析成為可能。

很多人認為“大數據”就是指數據量大,這是一個誤區。大數據的本質是發現和理解了信息與信息之間的關系,是思維的變革,而這種變革主要表現在以下三方面。首先,大數據強調的不是隨機樣本,而是全體數據。為了實現“全體數據”,需要我們盡可能多地搜集、保存與行業相關的各類數據和信息。其次,大數據時代,人們不再一味追求精確,而是承認混雜性。因此,人們需要對于非結構化數據給予更多的關注。也就是說,我們不僅要關注圖書銷量、讀者群構成、直接反饋;也要關注鼠標點擊、駐留在一本書的時間,后續購買、關聯購買情況,購買地點等。這些看似雜亂的信息,可能蘊藏著巨大的商機和價值。再次,大數據不再追求因果關系,而是關注事物之間的相關性。例如,沃爾瑪通過數據分析發現,在颶風來臨的季節,不僅手電筒的銷量增加了,某一種牌子的蛋撻的銷量也增加了,因此,沃爾瑪在颶風季節來臨時,將庫存的蛋撻擺放在靠近手電的位置,以增加銷量。在醫學出版中,我們也可以通過數據分析,找出與讀者的購買行為或閱讀需求相關的要素。

二、大數據在醫學出版選題策劃中的應用前景

1. 教材出版

各個出版社都很重視教材出版。不管是新編教材還是修訂教材,調研都是啟動編寫的基礎。教材調研,需要先搜集開設本專業學校的名單,逐個寄出調研函。學校的名單主要來源于相關學會、教職委、行職委提供的資料,但需結合前一版教材或相關書籍發貨的省市分布數據,有些時候這兩者有較大出入。例如,提供的名單中,河南省沒有學校招生,但出版社前三年的發貨資料中,河南省每年的教材發貨數很大。另外調研函發出后,回收也存在一定困難,通常只能做到部分回收。正因為學校的名單很難搜集齊全,調研函也不能全部回收,這種傳統方式上的調研,雖然力求全面,但仍是一種抽樣調查,很難涵蓋整個行業的樣本量和全部信息。

在大數據時代,一切都可以被數據化,大數據強調的不是抽樣樣本,而是全體數據,因此將數據分析引入教材調研,可以對互聯網上有關專業的開設省份、招生學校、招生人數等信息進行分析,得出更全面的數據分析報告。在教材修訂、搜集反饋意見時,也可以通過搜集論壇、網購機構的銷售記錄、讀者評論等,分析需要增加、刪減及修改的內容。在遴選主編、副主編及編者時,編輯同樣可以通過分析網站上的會議情況、會議日程、發言頻率和題目、各領域專家的專業特長,確定其學術影響,以及在教材中適合擔任的角色,并將這些信息形成分析報告,供決策者參考。

2. 學術專著

在傳統出版模式下,學術專著的選題方式屬于經驗型,由策劃編輯提出選題,報出版社選題會討論。選題委員會由社領導、經驗豐富的老編審、生產及銷售部門負責人等組成。選題會上討論的依據主要是以往選題的銷售情況及市場反饋,當前市場同類書的情況,以及其他出版社類似圖書的銷售情況。這種選題論證方式所參考的數據,只是整個出版市場數據的一部分。而利用大數據,人們可以獲得整個醫學圖書市場的書目信息、銷售情況,并進行分析。通過數據分析得出的報告,可以形象地理解成一批有無限經驗的策劃編輯、生產人員和銷售人員討論后得出的結論。理論上,這種論證模式更客觀、更有說服力。

現有的醫學相關網絡社區、數據庫的資源已經十分豐富,通過對諸如丁香園醫學論壇、中國期刊網(CNKI)、PubMed等的搜索記錄、瀏覽記錄、用戶留言,以及對亞馬遜、當當網的專業圖書購買記錄的分析,可以篩選出各個專業領域的熱點,并對相關用戶的地理位置、年齡、職稱等信息進行分析,準確定位讀者人群,并預測市場容量,為圖書選題提供參考。

3. 應急出版

應急出版對于醫學出版社來說是一個很重要的部分,在遇到較大的公共衛生事件或異常天氣時,公眾很需要專業出版社出版的相關預防書籍普及防范知識,醫師也需要專業書籍補充相關知識,專業出版社有義務為他們提供高質量的出版物。例如人民衛生出版社在2003年“非典”暴發時緊急出版的SARS診治、防范等方面的圖書,以及在2013年出版的《實面“霾”伏――“霧霾”中的生活與健康》。如果等到公共事件或異常天氣已經暴發再組織編寫,出版時間容易滯后。

大數據分析在應急出版方面將會有明顯的優勢。例如,谷歌公司通過對檢索詞條的分析,提前幾周時間預測甲型H1N1流感爆發。這個案例對于應急出版是一個很好的啟示。編輯可以通過類似的數據預測方式,如在流感暴發前,即組織編寫流感預防及治療相關的書籍。再如,如果能夠通過網絡的搜索詞條,或者同諸如中央氣象臺等單位合作,共享數據庫,提前預測會有嚴重霧霾天氣出現,就能提前組織專家編寫,為書籍出版贏得寶貴的時間。同時,可以通過搜索頻率預測印刷冊數,避免過多的庫存。

三、醫學編輯應對大數據時代的策略

1. 醫學編輯應做好基礎工作

一是立足自身,做好醫學編輯出版的大數據基礎工程建設。例如進一步實現網絡化、電子化和標準化,為實現大數據的應用打好基礎。只有將出版物網絡化、電子化,才能使與出版相關的信息和數據成為可以搜集的資源;大數據技術可以分析雜亂的數據,數據的標準化可以為數據分析提供更多便利。

二是學習借鑒,建立基于云計算等先進信息技術的新型工作模式。例如民生銀行開發的小微金融數字地圖平臺,通過這種地圖將數據可視化,由此提供相應的信息分析、營銷實務等服務。出版社如果建立類似的平臺,將銷售數據可視化,就能為選題策劃工作提供更多的服務。

三是尋求協作,引接信息產業界力量。例如一些新興的提供數據分析技術服務的公司,同它們積極合作開展大數據分析研究工作,推動研發基于大數據的智能選題策劃系統。

第2篇

專注大數據咨詢服務

Think Big公司是Teradata于2014年9月并購的大數據服務公司。Think Big公司聯合創始人兼國際業務高級副總裁里克?法內爾(Rick Farnell)介紹,成立于2010年的Think Big公司專注于開源數據服務,其愿景是幫助客戶運用新的開源技術,與現有技術優勢互補,從各種類型的數據中挖掘分析價值。

Teradata大中華區首席執行官辛兒倫(Aaron Hsin)介紹,自從成立以來,Teradata在過去40多年中一直專注做好一件事,那就是數據分析。Teradata幫助客戶通過有效的數據分析獲得業務洞察力,從而實現業務增長,提高利潤,為客戶提供更好的服務。

他強調,在過去的5到10年里,開源技術的發展和廣泛運用,使得半結構化、非結構化數據分析成為可能。為此,作為數據分析領域的全球領導者之一,Teradata積極跟進,除了自身研發以外,非常開放地融合優秀的開源數據分析技術,并形成了高效的統一數據架構(UDA)。據悉,Teradata 統一數據架構整合了Teradata 數據倉庫、Teradata Aster大數據探索平臺和開源Hadoop。

辛兒倫認為,在大數據生態系統建設中,客戶認識到需要整合不同技術架構的優勢,特別是在已有數據倉庫系統中融合開源技術,需要更好的工具來管理、訪問和利用這些平臺,尤其是需要具有實際經驗的團隊來指導Hadoop等復雜的開源系統的延伸部署。隨著客戶開始應用,或者開始嘗試應用諸多不同的技術架構或版本,它們面臨著很多技術選擇和路線圖規劃等實際問題,這往往會導致項目偏離既定的大數據戰略目標和業務目標。

“隨著各種規模的企業在落地大數據戰略時選擇不同的開源分析系統,客戶對開源系統咨詢服務的需求快速上升。我們致力于實現最新開源技術同現有成熟技術的優勢互補,借助我們優秀的數據科學家、數據工程師和咨詢團隊,幫助全球的客戶更快速、高效和便捷地獲取大數據價值?!崩锟?法內爾表示。

據悉,目前包括Intel、Facebook、NetApp、納斯達克(NASDAQ)、美國運通公司(American Express)和eBay等在內的知名企業,均是Think Big公司的客戶。正因為如此,Teradata收購了Think Big公司。

“Teradata擁有完整的大數據分析生態系統,借助統一數據架構實現Hadoop等開源分析系統、Teradata Aster大數據探索分析技術和數據倉庫環境的完美整合?!毙羶簜愓f,“借助Think Big專業的咨詢服務,Teradata將能夠向客戶提出多元化大數據的卓越咨詢建議,降低大數據分析系統部署和應用的難度,進一步強化統一數據架構的優勢,推動大中華地區客戶數據驅動轉型的實現?!?/p>

提供四大核心服務

記者在溝通會上了解到, Think Big在大中華區將廣泛支持廠商中立的開源解決方案,根據客戶實際的業務需求,推薦基于現有技術和解決方案的最佳技術和方案組合。Think Big致力于幫助客戶通過應用最新數據分析技術來獲得大數據的價值,提升競爭力和利潤。其核心咨詢業務包括:

其一,大數據戰略咨詢服務。根據客戶業務需求和戰略目標,制定符合企業需求優先等級和能力的大數據戰略,幫助企業更快地獲取大數據價值。里克?法內爾認為,現在很多客戶制定大數據戰略時有個誤區,就是盡可能采用最新的開源技術,事實上企業應該先考慮建立一個平臺,然后在這個平臺上建立、充實相關的能力。辛兒倫介紹,Think Big可給客戶制定一個為期6周的啟動數據分析應用的路線圖,幫助客戶確定流程和數據選擇的優先級,及其對業務的影響,并幫助客戶構建最佳數據架構;在此基礎上,還可給客戶提供為期12個月的發展路線圖,其中涵蓋Think Big的方法論。

其二,數據工程服務。根據客戶的業務目標,設計、開發和交付最適合的解決方案,提供現有分析架構優化和數據湖治理等服務。Think Big可提供數據湖的優化服務,以滿足客戶對生產系統、生產環境的數據服務需求。

其三,分析和數據科學服務。通過廣受認可的數據分析方法論,幫助客戶解決現存的業務問題,通過創新的數據分析方法,發掘全新的業務機會。

其四,管理服務和培訓。提供大數據分析系統的管理和優化,助力企業提高數據分析效率和洞察力,通過各種形式的培訓幫助企業真正獲得能力,提高數據和分析系統的采用和普及。人才短缺是客戶應用大數據的一大挑戰,而Think Big特別重視大數據戰略和專業技能的培養,尤其強調培養優秀的團隊是大數據戰略的最佳實踐。Think Big擁有強大的專家團隊資源和“Think Big大數據學院”,致力于為客戶和合作伙伴提供全面的人才培養服務,通過授人以漁的方式幫助企業實現數據驅動的業務成功。

已經有具體項目在開展

辛兒倫表示,Teradata在大中華區推出Think Big的全面服務,不僅體現了公司對高速發展的大中華區市場的重視,而且反映出客戶對Teradata和Think Big服務和能力的高度認可。

“自從有了Think Big團隊之后,客戶跟我們合作得更加緊密了?!毙羶簜惐硎荆琓eradata已經在華發展了20多年,積累了很多合作時間長達15年甚至20年的客戶,Think Big的業務能夠讓Teradata引入更多開源技術和解決方案,幫助客戶解決更多的業務痛點。

辛兒倫非??春肨hink Big在中國市場的前景。他透露,盡管Think Big的業務剛引進中國,但是用戶對相關業務的需求卻非常迫切,Teradata已經獲得了多個行業的客戶合同,并且已經有具體的項目在開展。

第3篇

電商營銷。營銷策劃。大數據分析。

的大數據分析基于現代社會中成熟的商業系統和日益成熟的電子商務系統。在整個電子商務社會體系中,消費者將逐步完成從傳統消費行為到對電子商務的理解和熱衷的轉變。在此過程中,大數據分析對消費者的心理特征和行為邏輯進行統計分析,并形成相關結論。為了在未來的業務發展中取得進一步的發展,電子商務營銷必須把握大數據的特點進行分析并實現合理的應用。

。在2019年的天貓“雙11”購物嘉年華中,11月11日,全球消費者在淘寶網電商平臺上購物,僅在凌晨96秒的時間內就在人民幣完成了100億元的營業額。這些數據的背后,反映了電子商務營銷對現代消費者心理和消費行為的準確把握指導。在中國電子商務發展過程中,逐步完成了第一代消費者進入電子商務平臺的培訓。這意味著國電商平臺大學的建設已經進入了一個相對穩定的發展時期。當“數量”不再是電子商務營銷的焦點時,如何確保電子商務平臺提供的商品和服務的“質量”已成為下一個潛在的出口。

毫無疑問,中國電商平臺近年來的突破和快速發展是驚人的,但在這種發展的背后,仍然存在許多問題電子商務平臺在商品質量、服務準確性和消費者需求控制方面有提升空間。在國內電子商務普遍反思自身營銷質量、優化策略的情況下,大數據分析已成為當前背景下電子商務營銷領域中一種適用性較高的應用技術。

2.1實現了目標受眾的第一次模擬考試。在傳統的電子商務營銷過程中,

通常被視為從單一企業到龐大消費者的擴散型銷售。然而,在模式判斷中,很容易忽視電子商務本身在調節產品質量、價格和銷售組合方面的靈活性?!半娚虪I銷是代表海盜,銷售廣泛,盲目追求銷售”大數據分析可以幫助電商在平臺上搜索、收集、瀏覽、購買和售后的全過程中比較各類消費者行為信息的細節,使電商平臺能夠完成對平臺上巨大消費流的宏觀調查,最終確定待營銷商品的目標受眾形象。Sri Lanca 2.2促進服務的準確交付。在

·

的電子商務營銷活動中,最重要的是優化售后服務鏈。如何提高用戶對產品的滿意度,降低用戶對電子商務營銷的警惕性,有效降低用戶的產品退貨率,正是傳統電子商務營銷規劃師在電子商務結束時所堅持的,大數據分析從源頭上提供了另一種解決方案,即:,通過對消費者心理預設和消費習慣的分析,明確適合每個消費者的產品和服務類型,從而增加電商平臺上的產品和服務與消費者的對應,也就是減少消費者的“試錯”提高電子商務平臺服務質量所需的時間成本。

23。有利于產品效果的長期跟蹤。在

,長期以來,電子商務產品一度被公認為“效果夸大”的代表還有長期價值低。電子商務營銷也被認為只重視誘惑和招攬,而忽視了后期的產品質量跟蹤。大數據分析只是為電子商務平臺提供了一個跟蹤產品效果的工具。消費者完成購買行為后,通過各平臺消費者活動和行為的變化,分析消費者對產品效果的滿意度,并根據消費者滿意度的量化評價,完成產品效果的評審和下一步迭代計劃的制定,有利于電子商務經濟的長遠發展。

3.1關注消費者保留率的統計

在傳統的傳播和營銷策劃中,我們經常關注鏈接或廣告的點擊率和點擊轉化率的統計,相信電子商務經濟通過大規模流失互聯網用戶群體實現貿易優化。但是,隨著消費者網購體驗的深入,點擊一次與最終購買的直接聯系逐漸減弱,消費者越來越關注電商平臺上的商品質量,這也意味著大數據分析的方向需要挖掘消費者購買行為背后的新邏輯關系。消費者保留是指消費者點擊一次電子商務產品后,選擇點擊兩次進入商戶的店鋪或進入同一商戶的另一商品鏈接,最終完成關注或收集的過程。這一過程意味著消費者通過自己的體驗和判斷,已經認識到電子商務平臺的營銷,并完成了對相關商品的價值感知。在消費者保留率統計中,我們必須使用大數據統計來比較消費者在每個頁面上的評論偏好以及不同圖片和信息的瀏覽時間,從而判斷消費者是否成功理解和同意預設的電子商務營銷策略。在這一過程中,大數據分析不僅成為企業了解目標受眾特征的工具,而且成為電子商務的重要工具自我營銷策略是分析電子商務營銷策略優缺點的工具,有利于電子商務營銷策略的進一步調整。

3.2分析消費者偏好和挖掘潛在消費熱點

在電子商務平臺上的運營基本上可以及時切入和分析。例如,以自由魚APP的rudder UI設計為例,電商平臺已經完成了每個功能塊的內容劃分,消費者進出功能模塊的時間記錄可以作為消費者對該類產品偏好的有效參考。同時,結合搜索引擎在電子商務平臺數據庫中的應用,可以記錄消費者輸入的相應關鍵詞,使電子商務能夠進一步控制消費者在一定類型下的產品特性需求方向。例如,一個25歲的白領可以輸入保暖、隔音辦公等關鍵詞,電商平臺可以得到“白領-隔音辦公、保溫操作、高性價比-隔音蓋耳式耳機”的營銷理念。通過對同類型消費群體的行為比較,可以推斷出該消費群體未來消費需求的發展方向,為電子商務營銷策略和產品迭代開發提供可靠的依據。

3.3闡明了消費者個人需求的重要性。

-

-大數據分析絕不是一刀切的“數據網絡-整體考量地區”。其實質在于對無限個個體數據進行有效疊加分析,然后通過各種數據之間的比較完成宏觀分析。這也決定了大數據分析應用于電子商務營銷后,企業必須關注消費者的個性化需求,避免因牟利心理造成的盲目調整行為。例如,當數據分析顯示有大量消費者也購買衣服時衣架在購買熱水杯時,不能將其捆綁促銷,以吸引新的消費熱點。消費者的購買行為是復雜的。企業越是使用大數據分析統計消費者行為,就越需要客觀看待消費者在消費過程中的各種特征,在分析相似消費群體共性的同時,分析消費者的個性化需求,避免對群體消費需求的誤判,導致錯誤營銷策略的出現,使大數據分析指導下的電子商務營銷始終處于靈活、靈活的營銷狀態。

。大數據分析為其提供了從數量到質量改進的可能性。企業必須對目標受眾的消費行為、消費習慣和消費心理進行有針對性的分析,調整營銷策略,實現營銷目標,同時提高電商品牌的美譽度,實現企業與消費者的雙贏。

引用

[1]徐麗的新著作。CRM分析與大數據背景下的電子商務前景[J]?,F代營銷(下一期十天版),2017(06)。

[2]王振江。大數據環境下電子商務精準營銷策略分析[J]。經濟特區,2018(06)。

[3]張龍輝。大數據背景下電子商務企業個性化精準營銷策略研究[J]。遼寧科技學院雜志,2019(03)。

第4篇

科學評測

《網絡傳播》:能否請趙總簡單地介紹一下CR-Nielsen的背景狀況?

趙舸:大家對華瑞網標這個名字可能還有些陌生,但如果提到華瑞網標的合資方以及合作伙伴的話,想必大家就都很了解了。華瑞網標(CR-Nielsen)是國際領先的市場咨詢公司――尼爾森集團旗下負責在線業務的中國合資公司,CR-Nielsen的數據合作伙伴是中國網站排名網(.cn)。依托如此雄厚的背景和豐富的資源,我們對CR-NetRatings的市場前景有著充分的信心。

《網絡傳播》:提到新推出的CR-NetRatings這個產品,趙總能否介紹一下?

趙舸:準確地來講,我們新推出的CR-NetRatings這個產品的內容不僅限于提供網站排名的數據,更多的則是數據分析方面的服務。

大家部知道,針對網站排名方面的數據,目前國內有很多數據研究機構都有涉足,但是在數據分析服務方面,整個行業當前依然面臨著缺少有權威、公正、科學的數據分析服務提供者的局面。CR-NetRatings新產品的推出,徹底地打破了這個局面,為中國互聯網行業的快速、健康、可持續發展,提供了貼心的服務。

《網絡傳播》:既然這樣,那么CR-NetRatings這個新產品中,都包括哪些數據和相應的數據分析服務內容呢?

趙舸:CR-NetRatings當中,共有七個大的功能模塊,分別為網站全國排名、流量趨勢分析、用戶重合度分析、人口特征分析、目標群體匹配分析、網站省級排名和網絡應用市場分析。從指標上來看,CR-NetRatings中提供了包括UB(獨立訪問用戶)、TS(總訪問次數)、UB Freq(訪問頻率)以及ASD(平均訪問停留時間)在內的多項指標,這些模塊中使用的各種數據指標,完全符合了國際上通用的指標定義,從定義上嚴格把關。此外,無論是對于網站主還是網絡從業人士而言都有著很重要的意義。

《網絡傳播》:據我所知,NielsenOnline有一個類似的產品叫NetRatings,那么此次這個CR-NetRatings和它有什么區別和聯系呢?

趙舸:CR-NetRatings和Nielsen在各種指標的數據當中,還提供了網站的全流量和樣本流量的各自狀況,方便用戶進行對比分析。

以“網站全國排名”這個模塊為例,在這個模塊中,用戶可以選取“按品牌”、“全部排名”、“分類排名”以及“分類總體指標”等多個方式來定制自己需要的網站排名數據。此外,數據分析的時間段落也可以自行設定,用戶可以查看周報、月報或季報等多種報告模式。使用這些功能,用戶不僅可以查看到某個品牌網站下的各級子站點的流量數據明細。還可以查看到某個時段內各行業網站的總體流量數據狀況以及變化程度等多種信息。

這些只是一些相對簡單的數據服務,CR-NetRatings這個新產品中涉及到的數據分析服務還包括很多,其中很有特色的一個就是“人口特征分析”,在這個模塊中,用戶可以分析訪問某網站用戶的具體狀況、與目標客戶群體之間的差異和重合度等,這些分析Online在海外現有的NetRatings之間有著一定的聯系,CR-NetRatings是在NetRatings的基礎上,針對國內互聯網行業和網站主的需求,加入了本土化的數據以及更契合國內實情的數據分析服務之后,整合而成的一個新產品。在CR-NetRatings當中,我們加入了國內的網絡數據,在充分了解國內網絡流量以及互聯網從業者需求的基礎之上,根據國內互聯網行業的現狀設計了全新的分析計算體系,它集國際上先進的數據分析方法和本土化的現狀為一體,能夠更好地為中國互聯網從業者提供服務,促進中國互聯網行業健康而又快速地發展。

《網絡傳播》:CR-Nielsen采用了哪些手段和方法來確保數據和分析結果的權威性、公正性和科學性呢?

趙舸:很高興你問到了這個問題,實際上,這也是目前國內互聯網數據分析行業當中普遍存在而又難以解決的一個問題,

首先,我們知道,數據采集工作是數據分析的基石,否則再科學的算法也只能是無米之炊。CR-NetRatings的數據首次采用了三位一體的模式,這三種數據獲取模式包括:Toolbar客戶端數據、在重點網站加碼以及部分sP運營商提供的原始流量數據。我們在分析過程中將這三個渠道所獲取的數據進行對比分析,打破了單一數據采集模式,從而保證了客觀、科學的分析結果。

其次,科學的統計算法是數據分析行業的核心。作為在數據研究市場上有著80多年歷史的公司,尼爾森集團擁有成熟的統計方法論與算法,而華瑞網標也對CR-NetRatings做了大量的本地化開發工作,以適應中國市場的需求。很多人通常會把數據分析等同于數據統計,實際上這是一項結合了行業經驗、專業知識、本土化開發的綜合業務領域。如果僅僅是算數并不難,但要是涉及如何建立模型、如何判斷原始數據的偏差、如何從統計結果中發現規律、如何積累出新的算法結論等問題時,就需要有雄厚的專業知識和技術經驗為基礎,才有可能完成,而這些恰恰是CR-Nielsen最寶貴的財富之一。

最后,在數據分析過程當中,審核管理機制是客觀、公正的保障。做排名分析既是引人注意又是容易引發爭議的事,所以公正與客觀是我們的命根。恪守職業道德是做這一行的基礎,科學的審核管理流程則是客觀保障。在中國做排名分析是一場博弈,其中涉及很多因素。技術可以提高審核效率和準確度,但無法代替科學的管理流程。為了保證對分析過程不受干擾以及對數據的異常變化做成正確的判斷,CR-NetRatings在數據收集、統計、三個環節相互獨立、相互制約,任何一個環節發現問題立即封凍數據,寧肯推遲或者不數據,也不會讓錯誤的分析結論流向市 場,從而又為數據和分析結果的權威、公正、科學加上了另外一層保護。

挖掘價值

《網絡傳播》:目前國內有很多公司和很多專家一直在為人們提供數據分析服務,對數據分析也有一些了解。您對數據分析服務的方法和用途有哪些見地?能否舉一些實例來進行說明呢?

趙舸:很高興知道如此多的人對數據分析這項工作如此感興趣,在這里我就以廣告主制作網絡廣告投放策劃這個例子來與大家交流一下數據分析方面的心得和體會吧。

我們知道,在廣告行業中有這么一段名言――“Half of my advertisingbudget is wasted,I just don't know whichhalf.”(我花在廣告上的錢有一半被浪費掉了,糟糕的是,我不清楚是哪一半。)但是,就算我們知道了錢浪費在哪里,又能怎樣呢?很多時候,對于廣告主而言,不得不白花這些錢。其原因就是因為很多廣告主還沒有意識到廣告投放是一份技術含量很高的工作,忽視了“分析”這一重要的步驟。在很多人的觀念中,廣告投放工作目前還只停留在看看媒體情況,聽聽廣告公司意見,抓抓廣告創意這種淺層次水平上。

實際上,廣告投放的過程,需要我們依據客觀的依據,參照精準的數據做分析,理性地制定出投放策略,再進行詳盡的效果監測。目前很多廣告主都忽視了廣告投放過程中重要的分析工作,或者他們分析工作做得還不夠透徹,不到位。

本行業廣告狀況如何?競爭對手的廣告怎樣?我要花多少錢做廣告?我該在哪里做廣告?我該做什么樣的廣告?我做的廣告效果如何?在確定要投放網絡廣告之后,這些便是隨之而來的一系列問題。如果將這些問題按照類別劃分,我們可以將它們歸結為以下幾種情況:本行業廣告投放分析、同行業競爭投放分析、投放預算分析、廣告創意分析以及廣告投放效果分析。問題已經確定,接下來的任務就是逐個細化并解決這些問題。

首先,本行業廣告投放分析中除了需要了解整體廣告投放趨勢之外,還要知道目前廣告的形式、活動以及投放平臺分布情況。

其次就是分析競爭對手的廣告投放行為,從大到小,從行業分析細化到直接會影響到自己的競爭對手身上來。

接下來,就是廣告投放預算了,本行業中都有哪些大的網絡廣告主,他們的廣告花費怎樣?競爭對手花了多少錢做廣告?參考這些數據,再對比自身需要達到的目標和實際狀況,我們就可以預估出自己的廣告投放預算。

想必大家都會想到,再往下的工作就是要決定在哪里做廣告,做什么樣的廣告,做多少廣告等實際問題了。在選擇投放媒介的問題上,我們不僅需要考量目前的客戶群,還要考慮不同媒體之間的用戶情況差異,將這些差異量化,以數據來輔助決策的制定。至于廣告創意的問題,我們可以將行業內和競爭對手的優秀廣告創意匯集起來,進行綜合的分析,根據自身、媒體和競爭對手的狀況,決定特定的廣告創意及形式。

最后的工作就是對廣告投放效果進行詳盡、科學的評估分析。雖然這項工作看似很簡單并且很繁瑣,但是這些工作卻對日后廣告投放工作有著很大的幫助。

《網絡傳播》:在聽過您的介紹后,我才發現原來我對互聯網數據分析行業還如此地不甚了解,那么能否問一下趙總,您為什么會想起做互聯網數據分析服務這個行業呢?

趙舸:隨著中國互聯網行業近幾年的快速發展壯大,各種新鮮的網站以及各種全新的網絡服務模式層出不窮,伴隨著中國互聯網行業的快速發展,針對權威、公正、科學的第三方數據監測服務需求的呼聲也越來越高。我們知道,一個行業的快速發展,特別是新生的互聯網行業的快速發展,無論是國家還是業內人士,都需要用到相應的數據分析服務,來對整個行業的發展現狀加以評定,同時,還可以根據針對這些數據的分析,結合國內外此行業的發展歷程,來對未來這個行業的發展方向和規模有一個清晰地認識。正是出于此種原因,我們才會瞄準這個市場,適時地為中國互聯網行業的提供權威、公正、科學的數據分析服務,實際上,我們所做的工作都是在為促進中國互聯網行業發展而努力。

第5篇

計算機審計是一種以計算機為先進的審計工具來執行經濟監督、鑒證和評價職能的審計方法。我國相關部門曾經對計算機審計作如下描述:“簡單地講,計算機審計包括對計算機管理的數據進行檢查和對管理數據的計算機進行檢查?!备鶕毡緯嫏z察院計算機中心的觀點,計算機審計有兩方面的含義:一是對計算機系統本身的審計,包括系統安裝、使用成本,系統和數據、硬件和系統環境的審計;二是計算機輔助審計,包括用計算機手段進行傳統審計,用計算機建立一個審計數據庫,幫助專業部門進行審計。 李學柔和秦榮生編寫的《國際審計》中作如下定義:“計算機審計與一般審計一樣,同樣是執行經濟監督、鑒證和評價職能。其特殊性主要在兩個方面:一方面是對執行經濟業務和會計信息處理的計算機系統進行審計,即計算機系統作為審計的對象;另一方面,利用計算機輔助審計,即計算機作為審計的工具。概括起來說,無論是對計算機進行審計還是利用計算機進行審計都統稱為計算機審計。”至于電算化審計與計算機審計在內涵上人們的理解基本相同。

可見,對“計算機審計”一詞的理解普遍存在兩個方面,即對計算機進行審計和利用計算機進行審計。1 計算機審計理論文獻綜述 國內學者對計算機審計的研究是多方面的,從計算機審計理論到具體的計算機審計技術都有研究。

在計算機審計理論研究方面,傅元略在《會計發展的新領域——Cyber Accounting(計算機網絡會計)》中提出了計算機網絡會計的概念,以反映會計電算化的發展趨勢。呂博的《在信息技術環境下審計理論的基礎研究》從信息技術環境下審計理論基礎的認定分析入手,對審計理論基礎與審計理論以及審計基礎理論之間的辯證關系進行了探討,并分別就信息技術環境下審計理論基礎的特點、內容和研究方法加以綜合論述等。來明敏在《淺談計算機審計模式》中介紹了可以從國際上借鑒的四種計算機審計模式,分別是繞過計算機審計模式、穿過計算機審計模式、利用計算機審計模式、在線實時(網絡)審計模式;并認為應尋找對策,從促進審計人員更新觀念、積極應用審計新技術、大力培養計算機審計人才、加快計算機信息系統環境下審計準則的制定、規范會計軟件設計,以及加大審計軟件開發力度等方面努力,盡快建立新的審計模式,從繞過計算機審計轉變為穿過或利用計算機審計,最終建立在線實時審計模式,加快我國審計現代化進程。唐飛兵在《關于構建我國計算機審計理論體系的探討》中系統地闡述了計算機審計理論體系的整體框架及各組成要素之間的相互關系,詳細地分析了審計環境和審計本質作為計算機審計理論邏輯起點的合理性,并對計算機審計基本理論內部層次關系的構建進行有益的探討。

也有不少學者在審計的技術應用方面做了研究。譬如,黃永平提出在計算機審計中,利用孤點分析法進行數據挖掘,發現一些特殊現象,比其他數據挖掘方法發現一些規律性的知識更有意義。何玉潔等在《計算機審計中的數據庫技術》中介紹電子數據的特點開始,討論SQL查詢和OLAP分析這兩種技術在實際審計中的應用成果,展示它們在計算機審計實踐中的特性和前景。

此外,學者們還對計算機審計的其他方面進行了研究。陳峰在《計算機審計方式下的數據分析報告》中分析了數據分析報告的作用及其必要性,并對數據分析報告的基本框架作了數據分析報告的文檔結構,就其要素內容做出了規范建議。還分析了當前審計實踐中對存在的一些認識上的誤區,并就規范撰寫數據分析報告的行為提出“制度形式對數據分析報告加以規范”和“審計組的討論和審核來保證數據分析報告質量”的建議。羅莉等在《計算機審計中內部審計與外部審計的分工協作》中認為,盡管計算機審計內容、方法與手工審計有很多不同之處,但從性質、目的、職能等屬性看,并沒有本質區別。由于信息技術具有很強的滲透性,很難將計算機審計與具體審計業務分離出來,因此,計算機審計不可能獨立于內部審計與外部審計之外。本文從審計主體的角度,綜合考慮計算機審計的界定,提出在計算機環境中內外部審計既要分工又要協作的觀點,并分析了分工協作的原則、內容等相關問題。趙輝在《計算機審計方式下的人員資源管理》中提出,在計算機審計方式下,一個單位的管理除了培養良好的單位文化,進行各種規章制度的建設之外,如何對審計人才進行管理,以適應這種革命性的變化顯得至關重要;而對審計人員而言,又應該如何加強自身的素質,提高自身的能力,適應計算機審計的需要,這是一個亟待探討的問題。 注冊會計師審計風險的成因與對策探析

淺析風險導向審計理論在我國的運用

第6篇

關鍵詞:民辦院校;法學教學改革;機遇

一、“大數據”簡介

大數據給法學教學帶來了對于如何分析學生學習情況的全新認知方式。

二、大數據為民辦院校法學教學改革帶來的新的發展機遇

民辦院校的教師師資力量弱,學苗差,學生考研率低,就業率低。長春財經學院在法學教學改革中,引入翻轉課堂教學模式。而大數據作為一種新的研究方式,可以為翻轉課堂提供更好的數據分析。(一)輔助提升法學學情分析。利用大數據可以從海量的數據分析中,提供教學需要的學生學習情況的信息。促進教師進行教學改革,提升教學效率。1.大數據對學習過程進行監控大數據則可以通過對學生線上學習過程進行監控,為教師提供數據幫助教師掌握學生學習情況。如為了防止學生觀看視頻的學習過程中有偷懶行為,保證學生學習的效果以及成績的真實性,超星等網絡平臺也采用了許多新的手段。2.大數據對學生學習效果提供統計數據大數據可以幫助教師對學習效果進行統計。如,提供隨堂測驗的統計數據等。在教學實踐中,如何對學生的學習效果進行合理的評價,仍是一個需要進一步改革的問題,尤其是采用翻轉課堂教學模式下。(二)輔助配置教學資源。大數據可以輔助教學資源的優化配置。在當前的教學改革工作中,要注重大數據的分析,特別是對于學情的分析,確保教學改革取得應有的效果。通過利用大數據對學生學習情況進行分析,查找規律,輔助教師評估每個學生的學習質量、效果及學習的困難點,從而合理分配教學資源。(三)促進教師和學生的良性互動。在網絡信息時代,學生對于知識的需求量越來越大,社會對于學生的能力的要求也越來越高,要求上崗即能上手,因此,學生需要真正能夠利用所學知識解決問題。而大數據可以更好的促進二者關系的良性互動。

三、大數據時代民辦院校法學教學改革面臨的主要挑戰

在大數據時代,法學教學改革迎來了新的問題。當前,法學教學改革中面臨著許多與大數據時代相關的挑戰,其中較為典型的問題包括如下幾個方面:(一)大數據對真實學情的掌控上,仍需完善。目前,超星爾雅平臺已經建立起了教學互動平臺,利用大數據對學生的網絡學習過程及效果,及時進行統計分析。然而,在實踐中,依然存在大數據無法掌控的問題,如不能真實的反映學生的學習效果。(二)如何運用大數據分析學情,仍需論證。目前,大多數的教師認為,目前大數據可以作為學情分析的參考,如分析學生的學習習慣,但不能以此作為認定學情分析的標準。綜上,在不斷的深入法學研究的方方面面,大數據為法學研究提供數據參考,也為我們法學教學提供數據分析,為法學教學的現代化提供有益的輔助支持。我們要提升重視現代化科技力量的運用。利用大數據對海量數據分析、整合,從而發現學生學情的新規律,提升法學教學水平,在運用大數據時,需要注意數據固有的局限性,對數據分析進行恰當合理的利用。

[參考文獻]

[1]JohnGantzandDavidReinsel,“ExtractingValuefromChaos”,IDCiView[J],(Jun.,2011),pp.1-12.

第7篇

【關鍵詞】大數據 聚類分析 行為分析模型 CELL ID OD調查

中圖分類號:TP391 文獻標識碼:A 文章編號:1006-1010(2014)-13-0038-04

1 大數據發展現狀和發展前景

1.1 大數據發展現狀

大數據(Big Data)具有4V特征,一是數據體量巨大(Volume),數據正在以指數級速度增長,一些行業每天產生的數據量達到TB級;二是數據類型繁多(Variety),包括以文本為主的結構化數據,以音頻、視頻、圖片、地理位置信息等為主的非結構化數據;三是價值密度低(Value),以視頻為例,在連續不間斷的視頻監控中,有用數據可能僅有一二秒;四是處理速度快(Velocity),這是大數據區分于傳統數據挖掘的最顯著特征,面對海量的數據,處理數據的效率非常關鍵。

近年來,大數據應用隨處可見。谷歌通過分析人們在谷歌的搜索關鍵詞,提供再捕捉服務,通過這種服務谷歌每年可以獲得10億美元的收入,亞馬遜通過對其平臺上互動交易的數據進行挖掘,使其在交易當中獲得更好的收益。多國政府部門將大數據技術應用到便民服務和政府執法領域,例如當一輛套牌車開往某個停車場,基于大數據分析的車牌識別系統可以很快通知最近的交警前往執行處罰,交通部門開放運營車輛GPS數據,向市民道路實時路況。

1.2 大數據的發展前景

隨著技術創新和行業需要的推動,大數據產業已步入了快車道。IDC報告稱,在中國,與大數據建設相關的硬件軟件服務在2016年將超過6億美元。

維克托?邁爾在《大數據時代》一書中指出:大數據開啟了一次重大的時代轉型。就像望遠鏡讓我們能夠感受宇宙,顯微鏡讓我們能夠觀測微生物一樣,大數據正在改變我們的生活、工作以及理解世界的方式,成為新發明和新服務的源泉,同時更多的改變正在蓄勢待發。

大數據以一種前所未有的方式,通過對海量數據進行分析,獲得具有巨大價值的產品和服務。數據是信息社會的根本要素,挖掘多變的、海量的數據,不僅能為全社會提供創新的信息服務,而且能夠為各行業創造價值,因此大數據應用前景非常廣闊。

2 移動通信大數據在城市人口管理中的

應用

2.1 移動通信網絡數據的價值

運營商的數據十分寶貴,包括網絡數據、用戶數據、位置數據、用戶行為數據、設備終端數據等。

(1)運營商擁有海量的網絡資源數據,全國數以百萬計的基站形成了LBS應用需要的CELL ID(CELL Identity)數據,CELL ID是指移動通信無線網絡上報終端所處的基站小區號。

(2)2010年9月1日實施手機實名制之后,在保障通信安全的同時,運營商擁有了較為準確的用戶資料和消費信息數據。

(3)根據移動通信原理,網絡需進行小區切換和周期性位置更新,這種定期產生的大量位置更新信息就形成了位置和軌跡數據。

(4)用戶在進行發送短信、通話、數據上網、開關機等行為時,會產生大量的用戶行為數據。

(5)所有終端在建立與網絡的連接時,均會上報終端的IMEI號,形成了豐富的終端設備數據。

上述5類數據,經過數據分析和數據挖掘,為行業研究和服務創新提供可靠的依據,為城市人口管理和公共安全提供決策數據支持。

2.2 需求分析

隨著城市經濟水平的不斷發展,城市人口呈現數量多、增長快、流動大等特點,給經濟社會發展和社會治安帶來巨大的壓力,給城市人口管理和服務工作帶來前所未有的挑戰,政府主管部門積極探索城市人口管理的新模式。如何準確地分析城市人口分布和流動情況?如何采用創新手段提升管理和服務水平?采用科學的方法和先進的技術對移動通信網絡數據進行數據分析和數據挖掘是一個非常好的突破口。據工信部的通信行業統計數據,2014年5月底中國移動電話用戶總數達到12.56億戶,移動電話普及率達92.3部/百人。由此可見,移動通信網絡大數據將在城市人口分析和管理工作中顯示出獨到的優勢和價值。

通過移動通信網絡大數據挖掘和分析,能方便快捷地獲取以下信息:城市人口分布及流動情況、城市居民OD調查、城市人口異常聚集、特定區域的經濟發展狀況等。

2.3 系統架構

基于移動通信大數據的城市人口管理系統架構分為4個部分,如圖1所示,功能描述如下:

圖1 基于移動通信大數據的城市人口管理系統架構

(1)數據層,負責從外部系統獲取基礎數據,包括全網的話單、短信、上網流量數據,以及移動通信網絡的信令數據。外部系統在向本系統輸出基礎數據之前,需要開發一套程序完成原始數據的格式轉換和數據處理。首先要屏蔽用戶隱私信息,即用戶號碼信息全部剔除,輸出時采用經過加密的IMSI號碼。其次需要篩選出關鍵字段,每條記錄都是從原始數據的幾十個字段抽取出幾個關鍵字段,這樣能大大減少數據存儲量。

(2)處理層,負責對獲取的結構化和非結構化數據進行處理,并準確匹配到上層定義好的各類計算模型。數據處理層采用了基于開源的Hadoop分布式架構,將傳統ETL的數據提取、數據清洗、數據轉化、數據校驗工作承載在云計算平臺上,大大降低了大數據的處理成本,提升海量數據處理的及時性。

(3)模型層,定義了與需求相關的3大模型:

位置分析模型:負責存儲對城市地圖處理后的信息數據,包括了網格的經緯度信息和對應的基站信息。結合GIS地圖信息,獲取用戶位置。

用戶分析模型:負責存儲用戶信息,重點包括了用戶在城市生活中重要的“居住點”和“工作點”的經緯度信息。通過該模型可以分析用戶在城市的生活軌跡。

用戶撥打重點電話模型:負責存儲城市內撥打110、119、120、122等電話的時間、地點。通過該模型可以分析出城市的安全、消防、交通報警電話的時間、區域以及趨勢。

(4)應用層,基于B/S架構,采用模塊化獨立封裝技術與標準化應用接口,功能強大且擴展性強,可平滑擴展到城市人口管理以外的其他行業。

2.4 算法描述

在進行移動通信網絡海量數據分析和數據挖掘時,主要采用了聚類分析計算方法,包括地圖網格算法、人口分布算法、人口流動模型算法。聚類分析指將對象的集合分成由類似的對象組成的多個類的分析過程,聚類分析的目標就是在相似的基礎上收集數據來分類。

(1)地圖網格算法:首先針對城市地圖建立坐標系,將地圖空間劃分成為有限個單元的網格結構,所有的處理都是以單個單元為對象。單元網格面積大于基站平均覆蓋范圍,因此定位精度能滿足城市人口出行信息分析的技術要求。具體方法如下:

針對城市地圖建立坐標系,按基站小區平均半徑250m,建立網格。

為城市的所有基站分配經緯度,從而把基站全部匹配到網格。

對跨行政區域的網格,在數據分析時做特別處理。

根據用戶發生通信行為時所在的網格,精確計算用戶位置和軌跡。

(2)人口分布聚類分析算法:根據用戶發生通信行為所在基站位置數據和網絡發起的周期性位置更新數據,以加密后的IMSI號作為分析對象。在時間上,按時間段計算出每個加密IMSI號出現的次數;在空間上,將加密的IMSI號匹配到疊加了網格數據的城市行政區域分布圖,挖掘出每個區域某個時段的人口數量。具體步驟如下:

確定移動通信網絡活躍用戶總數。

設定居住地時間為18點至次日8點,工作地時間為8點至18點。

根據用戶發生通信行為所在的基站經緯度,計算所在網格的位置。

計算居住地和工作地網格內的用戶數量,為了數據的準確性,以3個月為一個數據采集周期,如果一個用戶出現在多個地點則以出現次數最多的地點為準。

根據用戶網格歸屬統計用戶的區域分布。

(3)人口流動模型算法:本項目需設置多個聚類分析對象,我們給每一個聚類設置了一個模型,然后計算滿足這個模型的數據集。主要的3個模型為位置分析模型、用戶分析模型、安全監測模型。如圖2所示:

圖2 基于移動通信大數據的城市人口管理分析3個模型

2.5 結果輸出

本項目利用移動通信網絡語音、短信、上網數據及網絡信令等海量數據,通過特定的算法,建立分析模型,輸出了以下城市人口管理分析成果:

基于移動通信網絡數據的城市各區域人口數量分布;

城市人口居住地、工作地分布;

城市居民OD調查(Origin Destination Survey),即交通起止點調查;

城市人口連續出行軌跡;

城市人口異地出行量、出行目的地分布;

特定區域人員聚集分析;

城市各區域經濟發展情況。

3 結束語

大數據被譽為“21世紀的新石油”,運營商擁有海量的網絡數據、用戶數據、位置數據、用戶行為數據、設備終端數據。通過搭建大數據基礎平臺,進行數據分析和數據挖掘,開辟創新應用的藍海,為相關行業提供新型信息服務從而實現價值創新,為政府的城市管理提供決策支持,運營商的數據十分寶貴,早挖掘,早受益。

參考文獻:

[1] 維克托?邁爾-舍恩伯格, 肯尼思?庫克耶. 大數據時代[M]. 盛楊燕,周濤,譯. 杭州: 浙江人民出版社, 2012.

[2] 涂子沛. 正在到來的數據革命[M]. 桂林: 廣西師范大學出版社, 2013.

[3] 涂子沛. 數據之巔:大數據革命,歷史、現實與未來[M]. 北京: 中信出版社, 2014.

[4] 劉軍. Hadoop大數據處理[M]. 北京: 人民郵電出版社, 2013.

[5] IT架構設計研究組. 大數據時代的IT架構設計[M]. 北京: 電子工業出版社, 2014.

[6] Anand Rajaraman, Jeffrey David Ullman. 大數據:互聯網大規模數據挖掘與分布式處理[M]. 王斌,譯. 北京: 人民郵電出版社, 2012.

作者簡介

第8篇

HANA數據分析平臺在軟件方面,通過內存技術,應用程序能直接處理電力企業數據庫中的各種數據,并直接在主內存中處理。主要技術包括行+列的存儲、壓縮、數據分區、增量數據更新等。平臺采用的軟件包括數據抽取工具、內存數據庫(含數據庫服務器、建模工具Studio、客戶端工具)、報表展現層BusinessObjectsBI組件。在硬件方面,通過預配置的軟硬件結合體,提供高性能的數據讀寫操作,并在內存數據庫里采用列式存儲從而將更多的數據存入(列式存儲方式更適合數據壓縮)。

2HANA數據分析平臺實施過程

數據分析平臺建設應遵循最大限度的考慮應用實用性、縮短實現周期、降低技術風險等因素。

2.1需求分析

需求分析是要對用戶的訴求或需求進行深入了解,并在需求的基礎上對整個平臺進行一致約定。因此以重要性、分析的復雜性、數據量大小、以及快速見效為原則,需求分析需要明確下面的內容。

1)選擇需要分析的主題,結合當前電力營銷業務在計量、業擴、抄表、電費核算、電費繳納、賬務等工作職能的劃分,也要考慮分析的主題具有針對性的業務場景,這些場景往往跨越多個職能。

2)分析并描述各個主題的業務背景,包括使用的用戶角色,使用的業務場景。以電費出賬異常為例:電費出賬異常主要是由于用戶檔案錯誤、抄表錯誤所引發的,涉及到業擴、抄表、電費核算等多個職能部門。以電費出賬異常作為分析的主題,其業務場景主要用于電費發行后,對引發電費異常的用戶檔案數據、計量信息、抄表信息進行檢查并按職能需求進行分別展示。

3)分析各個主題間的關系,在這個平臺上用戶的所有活動信息,如用戶請求的數量,用戶對這些數據的訪問頻率、時間、數據細節層次、請求多大的數據量等之間的關聯。

4)分析主題所涉及的表的目錄、表的內容、表的容量、每個表的平均行大小、表的記錄數、表的增長情況等。

2.2平臺規劃

HANA數據分析平臺應用架構一般采用四層:數據源層、數據抽取及復制層、HANA數據集市層以及報表展示層。

1)數據源層:作為平臺的分析對象,提供報表分析所需的數據,數據源層可同時支持各種類型的數據庫,數據源層為營銷系統(管理庫),生產庫到管理庫之間采用SharePlex復制工具實現數據同步,以避免數據抽取對生產系統的影響。

2)數據抽取和復制層:數據抽取和復制層負責將數據源層中源系統的數據抽取和復制到HANA分析數據庫中,主要構成是數據抽取和復制工具,可以分別采用實時同步服務(SLT)以及非實時同步的數據服務(DataService)兩種不同的復制工具來滿足不同特征的源數據要求。在確定采用哪種工具前,需要對每個數據源的大小、變更時間、變更頻繁度、增量大小等信息做詳細了解,對不同數據源表選擇合適的復制工具。

3)數據集市層:數據集市層是整體系統架構的核心,負責分析數據的儲存、報表模型的建立以及數據計算。該層包含分析數據庫以及虛擬模型架構兩個主要組成,所有需分析展示的數據在數據集市層通過集市層進行儲存、壓縮、建立邏輯模型并計算,通過該平臺特有的內存計算技術可以使這個過程的效率大幅提升。

4)報表展示層:報表展示層負責將HANA數據庫中的數據運算結果按照報表需求進行展示,采用SAPBusinessObjectBI4.0以及EXCEL作為展示工具。

2.3平臺實現

2.3.1模型設計

依據報表的需求分析、功能需求、性能需求、模型擴展性、模型的靈活性、實現成本進行平衡,在達到性能要求的前提下,設計出可以重用的模型,HANA平臺不同于傳統的數據倉庫需要物理化模型設計,HANA采用了邏輯視圖模型設計的概念,邏輯視圖從表面看體現的是傳統的星型、雪花型模型設計,但這些模型中的數據并不是物理存放的。HANA提供了屬性視圖、分析視圖、計算視圖三種模型設計,屬性視圖實現對維度的設計,分析視圖則實現傳統的星型模型設計,計算視圖實現更復雜的雪花型模型設計。模型設計時是先將需求階段所確定的分析主題作為分析對象,梳理每個主題展示所需的事實表數據內容和數據粒度、分析維度、分析的數據指標。例如:一個以分析電費構成為主題的業務場景,該主題分析當期電費的構成情況,并同期比較各個電費構成的變動情況,那它的指標可以為目錄電度電費、峰谷品跌、豐枯品跌、基本電費、力調費、代征費、電度電費、結算電費等指標。分析的維度可包含:時間維度、用戶維度、組織維度、用電服務維度、抄表維度、計收維度等。并在此時完成對事實表和維度表的邏輯數據模型設計。

2.3.2表樣及功能設計

報表的樣式和功能應當考慮用戶對數據進行分析的使用習慣,借鑒數據倉庫中的多維數據可視化方法,通過對報表的上鉆、下鉆、切片等展示功能技術的利用,實現對匯總性數據、明細類數據、核心數據的快速查看和分析。以上述的分析電費構成主題為例,其展示需求決定表樣的設計采用圖型混合表格的方式,功能上采用按照組織維度進行上鉆、下鉆功能可查看不同供電區域的電費構成情況和各個指標的排名情況,前端展示采用了BOWebintelligence嵌入DashBoard圖表設計實現。

2.3.3數據抽取及復制設計

為確保數據質量,應當進行數據抽取和復制的規劃設計。首先,根據模型設計中指標、維度信息分別列舉出其相應的數據來源,即營銷系統的物理表和字段,指標來源于營銷系統的交易數據,而維度來源于營銷系統的主數據。其次,根據邏輯數據模型和數據來源確定營銷數據庫到HANA數據庫的ETL規劃,根據數據的質量規則(包括:數據清除、空值處理、數據替換、規范化數據格式等),確認營銷系統源數據到HANA目標數據庫數據的轉換規則,同時依據數據大小、數據變更時間、數據變更頻繁度、數據增量大小要求確定采用的實時工具SLT還是定時抽數工具BODataService,例如:收費賬務相關的交易數據存在記錄基數大、變更頻率很高等特征,采用實時復制增量數據更合適,而賬務的月結數據僅在每月初產生且數據量非常巨大,因此采用定時批量復制更合適。

2.3.4模型及報表開發

模型及報表開發共分為數據裝載、HANA建模、定義語義層(IDT)、報表開發、數據校驗五個步驟,這五個步驟相互交疊與重復,直至到達最優化設計。其中數據裝載的方式利用了SLT的實時同步技術,SLT同步技術其核心是基于數據庫的觸發器模式實現對源數據的增量復制,最大限度的避免了對源系統表結構的改變,同時采用的多任務復制機制使得實時復制的效率可保持在5~10秒內的數據延遲,裝載后的HANA數據的大小比較源數據庫數據大小可壓縮30%~70%的容量。

3發展前景

不斷的完善HANA數據分析平臺的分析主題,不僅是基于電力營銷系統,還可以基于用電采集系統等構建起電力企業的大數據分析平臺。利用HANA內置的PAL(預測分析庫)對海量電量數據、客戶服務數據實現數據高級分析,建立其有效的事前預測、事中控制、事后改善的企業快速輔助決策模式。營銷業務可以在客戶服務中對受理業務的情況信息、執行過程、執行結果進行深入分析、對客戶需求進行快速響應,改進服務質量、提升電網服務建設。更可以利用海量電能量數據對偷竊電稽核、客戶用電行為、能效管理等進行過分析和應用,助力營銷輔助決策與分析能力的快速提升。

4結論

第9篇

關鍵詞:大數據;客戶訴求;客戶分群;交互服務

1智能分析系統技術組成

1.1系統技術路線

基于Redis緩存開源技術,實現多類別的數據結構以及功能豐富的String支持。采用EPOLL實現可擴展IO事件處理機制,顯著提高程序在大量并發連接中只有少量活躍的情況下的系統CPU利用率。通過自動分庫分表,無縫隙的擴展數據節點,實現數據隨著數據量的擴展而擴展。

1.2系統原理架構

大數據的分析處理需經過數據采集、數據管理、數據計算、業務應用4個階段。因此大數據分析平臺業務架構也相應地按照4個層面進行設計。

1.3系統數據分析

基于95598客戶服務中心每天下發的大量工單數據,進行高頻詞分析提取,匯總高頻詞出現率,形成客戶當前關注熱詞指數排行榜。a.數據模型。獲取業務服務記錄,經過分詞處理后使用VSM模型衡量關鍵詞權重,得到業務內容中的關鍵詞語。經過一次聚類(LDA算法)轉化得到短語,二次聚類(LDA算法)得到事件列表,最后經過熱點度量后進行可視化展現。從而實現客戶關注熱點的自動獲取,為事件監控、服務改善、工作調度提供幫助。b.數據處理。采集原始數據中文分詞按主題聚類提取熱詞形成用戶行為分析熱點訴求分布圖。

2智能分析系統實施方案

系統實施方案有4部分組成,可以有效利用先進大數據技術,實現大數據分析輔助營銷優質服務決策。a.基于營銷95598系統的基礎上,擴展系統數據挖掘與分析功能,實現對業務工單信息的按主題分析,準確定位各類業務的分布規律、專業存在的突出問題。b.通過95598停電信息、故障報修和供電質量投訴診斷電網供電能力中的問題:依托三級標準地址與配電臺區的關聯關系,準確定位上述客戶訴求的區域、供電線路、臺區信息,為制定配網規劃、開展設備治理提供信息。c.通過營業服務投訴診斷營銷管理中存在的問題,客戶反映的業擴報裝超期、無票白條收費、估抄漏抄電表、營業廳不開門、服務態度等問題是監督制度落實的有效手段,為改進專業管理指明了方向。d.通過及時解決客戶的需求,主動的去了解客戶的關注熱點,從客戶最關注的方面進行服務和管理的提升,根據客戶關注點及請求頻率等客戶特征,按照偏好標簽庫和交互頻次設置,自動識別客戶的偏好標簽和交互頻次類型,形成一定用戶量的客戶分群,為該群體提供更多個性化的交互服務和營銷服務。

3智能分析系統應用效果

該系統目前已完成上線運行,已在國家電網有限公司系統范圍內開通省、市、縣應用賬號262個,實現系統應用。應用效果有以下幾個方面。a.實現客戶訴求可視化展示。對客戶訴求發生趨勢、重復撥打情況、臺區停電等多維度可視化展示,直觀展現優質服務薄弱環節。b.實現客戶訴求趨勢預判。通過分析客戶訴求“熱詞”、“主題”等方面,精準定位客戶訴求關注熱點,實現客戶訴求區域、時間等維度預判。c.實現客戶標簽化管理。對客戶用電性質、訴求內容等客戶屬性進行標簽化,分析客戶的用電量、撥打偏好、關注熱點,實現客戶群體的分群、分級管理。d.經濟效益及推廣前景。該系統投入使用后,2017年上半年電網建設投訴同比下降57.5%,營業投訴同比下降37.3%,故障報修工單下發數量同比降低30%,有效提升人員工單流轉效率40%,客戶滿意率達99.18%,達到國家電網有限公司A類水平。

4結束語

本系統利用先進的大數據分析技術手段,使海量的數據資源價值得到有效利用。精準的客戶個性化服務,加強了客戶服務粘性,提升客戶忠誠度,切實提高企業經濟效益。構建的客戶訴求風險防控預警體系,切實提升服務風險防控,降低負面輿情及企業服務風險,提升客戶滿意度。為開拓電力市場,應對電力市場改革打下良好基礎,可在國家電網系統內全面推廣應用。

參考文獻:

[1]楊麗霞.95598系統運行數據分析及改進建議[J].科技創新及應用.2014(15):144.

[2]程超,張凱,程慧.95598系統數據的分析方法及其應用[J].河北電力技術.2015,34(3):37-38.

第10篇

關鍵詞:大數據;分析及挖掘;交通行業

1技術背景

21世紀,伴隨著信息技術和互聯網的爆發式發展,人類進入大數據時代。數據成為國家核心戰略資源和社會財富[1],全球范圍內研究發展大數據、運用大數據推動經濟發展成為大勢所趨。IBM公司研究報告表明,當前各行業數據的分析利用率極低,僅為1%。交通行業數據雖然由于細粒度、連續性及信息豐富等優勢具備大數據分析挖掘基礎,但也由于數據增長快、覆蓋面廣、數據深度高、格式不統一、信息孤島等原因,致使其分析挖掘比例更低。因此,加快交通大數據的清洗、分析挖掘及應用等關鍵技術攻關,對積極響應國家大數據戰略、交通強國戰略,促進山西經濟轉型意義深遠。

2現有基礎

2.1政策保障

山西省通過加快組織建設與政策保障推動大數據技術推進,給予大數據產業系列政策支持,發展潛力指數位居全國前列。2016年,山西省《山西省國民經濟和社會發展第十三個五年(2016—2020年)規劃綱要》和《山西省“十三五”戰略性新興產業發展規劃》,明確構建現代綜合交通運輸體系,推動大數據、云計算等戰略性新興產業在交通運輸、環保、國土資源等行業領域應用;2017年,山西省《山西省大數據發展規劃(2017—2020年)》,力求在大數據戰略實施上取得突破,促進全省經濟轉型發展;2019年,《山西省促進大數據發展應用2019年行動計劃》再次明確“推進大數據在交通、旅游等民生領域應用不斷深入”;2020年4月,山西省《山西省大數據發展應用促進條例》,要求推動經濟社會各領域的數字化、網絡化、智能化發展。因此,山西省交通大數據產業化發展符合政策導向。

2.2數據基礎

自大數據國家戰略實施以來,山西省積極推進山西聯通、山西移動、山西電信、百度(陽泉)公司、呂梁軍民融合研究院、北斗山西分公司等大數據中心建設,推動浪潮集團、華為公司、新華三通信公司等互聯網企業數據中心和云平臺項目在山西省落地建設。2019年,山西交通控股集團著力打造了自己的數據中心。山西省交控集團數據中心的建設使山西省交通大數據分析及挖掘工作成為可能,為深化大數據在交通行業的示范應用奠定了數據基礎。

2.3技術基礎

山西省交通科技研發有限公司致力于交通運輸行業的科學研究與技術咨詢,近五年,交研公司智能裝備、智慧交通、交通安全及橋梁與隧道工程等研究院累計承擔國家、省部級大數據相關科研項目7項。同時,項目開展過程中形成了由3名博士牽頭、10余名碩士為技術骨干的“大數據分析與應用”“數據挖掘”“數據可視化展示”等跨院技術合作團隊。

2.4人才資源

截至2019年底,全國共477所高校本科專業獲批,山西省以14所高校的總量位居全國第五,如太原理工大學、山西大學、中北大學等。數據科學與大數據技術專業的設立培養了大批社會急需的具備大數據處理及分析能力的高級復合型人才,為交通行業數據分析及挖掘奠定了人才基礎。

3研究方向

3.1研究內容

基于交通行業大數據規模大、速度快、多樣、價值密度低等特點,建立大數據處理技術體系[2],并開展存儲及融合、分析及挖掘、可視化決策、數據應用等研究工作。

3.1.1多源異構數據的混合存儲及融合技術交通行業在生產、設計、施工、經營及管理過程中會產生大量異構數據,多源異構數據的統一存儲及融合技術是首先要解決的關鍵問題,也是對交通大數據進行充分挖掘和應用的前提。開展數據存儲技術及融合算法研究,并建立適用于交通行業的數據模型,實現異構數據的快速存儲及查詢、錄入數據的統一標準化,是當前交通行業大數據分析工作的重點之一[3]。

3.1.2基于云計算的數據分析挖掘體系建立基于云平臺的數據分析挖掘體系,提高非向量數據的挖掘能力,開展基于分類、回歸分析、Web數據挖掘等方法的數據分析研究[3],并建立各類型數據挖掘模型,實現各結構類型數據的分析與深入挖掘,進一步提高交通行業大數據的服務價值。

3.1.3數據的可視化決策基于新型數據可視化決策技術,將復雜的數據信息以圖、表形式直觀顯示,并動態呈現數據變化趨勢,提高管理人員依據數據進行生產經營管理決策的科學性[4]。

3.1.4提升數據應用水平積極響應國家大數據發展戰略,借助物聯網、云計算等技術[5],切實推進大數據技術在交通產業的應用,打造深度融合數據存儲、分析、挖掘、加工處理和應用展示的高度集成平臺,從而促使交通行業的信息化管理水平取得全面提升。

3.2典型應用

基于現有數據開展面向交通運營的數據分析與挖掘技術研究工作,列舉幾個典型應用:(1)基于集團業務數據及戰略布局,建立集團統一數據標準,通過數據清洗實現不同數據互聯互通?;诖髷祿诰蚣夹g,建立業務數據模型,充分繪制潛在客戶畫像,為集團提供針對需求的預測數據進而驅動業務增長。(2)基于視頻監控系統積累的海量數據,開展高速公路視頻大數據挖掘分析與應用,構建以交通流大數據為特征的數據處理模型,解決道路擁擠、車輛稽查、交通安全等問題,提升高速公路整體營運管理和服務水平。(3)交控集團管理運營高速公路超5000km,占全省高速公路總里程95%以上,基于高速公路收費系統積累的海量數據,開展高速公路貨運/客運情況的大數據分析,預測山西省經濟景氣情況,助力山西經濟轉型發展。(4)基于交控集團在高速公路等重大交通基礎設施開展的全過程業務,創新型引入大數據能源管理,在設計規劃、施工段、運營等多個階段通過數據化的能源管理系統實現基礎設施建設的安全、綠色、智慧,積極響應國家發展戰略。(5)基于集團在高速公路路面、隧道、橋梁等開展的檢測、監測及養護業務,開展病害數據、養護數據的分析與挖掘,為交通基礎設施建設和養護提供全方面的決策信息支持,提高服務水平。(6)緊跟技術前沿,開展面向交通安全等相關領域的數據分析與挖掘技術研究。

4發展前景

第11篇

【關鍵詞】大數據;智慧酒店管理;酒店管理;策略研究

數據的開發和應用,對于酒店智慧化的發展有著非常重要的現實意義。在大時展的背景下,大數據應用在酒店管理或是傳統酒店運營模式的轉變中都受到了相關專家的熱切關注。近年來,大數據應用與酒店布局管理一直保持著密切的交流,這對于酒店管理來說也將迎來一個以大數據開發應用為核心的酒店管理時代的到來[1]。

一、大數據與智慧酒店管理

(一)相關概念闡述 大數據具體是指以多元化的形式,從眾多來源中搜集而成的一個巨大的數據組,所以通常情況下它具有一定的實時性特征。這些數據可能從社交網絡、電子商務網站以及顧客來訪紀錄作為主要來源,所以它并不是公司與顧客關系管理數據庫的常態數據[2]。

上世紀八十年代初,未來學家阿爾文?托夫勒在《第三次浪潮》一書中,將大數據熱情地贊頌為“第三次浪潮的華彩樂章”。大數據蘊含著這些數據生產者的真實意圖、喜好、目的的非傳統結構和意義的數據,他們從海量數據中提煉出有用的信息,這些信息的有效處理對于網絡架構和數據處理能力的挑戰也是全新的。

(二)智慧酒店管理 智慧酒店是指酒店擁有一套完善的智能化體系,通過數字化與網絡化實現酒店數字信息化服務技術。智慧酒店管理則是借助數字化與網絡化的平臺,在酒店管理的過程中開發相關的系統,形成牽一發而動全身的局面,智慧酒店管理有利于降低酒店管理成本,減少不必要的勞動力,更重要的是可以幫且開發客戶群,更有針對性、個性化的對客服務,滿足客人對酒店標準化服務基礎上建立的個性化、焦點式、延伸性的服務。

二、大數據應用于智慧酒店管理的現狀

(一)在酒店管理方面對大數據的認識不夠全面 在不同的發展進程中,酒店行業發展就會遇到不同的機遇和挑戰。在新時期大壞境中,伴隨著大數據的產生為酒店管理行業的發展帶來了更好的發展平臺。大數據就是把酒店客戶的資料信息進行有效的綜合整理,以便于酒店在布置布局方面有了更好的數據基礎,促進了酒店行業的經濟快發展[3]。

在客戶信息采集方面,于酒店而言是非常容易就可以進行的。但在實際的操作中,酒店在客戶有效信息采集方面還存在有很大的漏洞和不重視,缺乏對客戶信息有效性以及相關信息的印證。這就導致了數據庫基礎看起來數量規模龐大,大往往都是涂有華麗的外表,沒有實際的作用。酒店方面對于大數據的認識不足,認為數據的采集僅僅就是為了酒店入住率的核算,在意識中尚未對大數據應用做出正確的定位。

(二)數據分析方面 經過調查分析不難發現,大多數酒店在客戶信息數據的整理利用方面都存在不同程度的缺陷。僅僅用于酒店內部的銷售營業報表以及酒店盈利年度預算方面,沒有對這些數據進行更進一步的開發分析。嚴重的浪費了大數據在酒店運營市場開拓、行業市場分析以及客戶需求整合這些方面的重要作用。大數據在酒店行業中使用較為成熟的依然是華東地區,而西北地區則使用較少,為了全面展現大數據的分析作用,在此僅以蘇州酒店數據開發為例:

蘇州某時段酒店客戶數據分析比較

該地區在全國的酒店總數量排名中僅次于超級大都市北京、上海,在酒店運營方面有自身本來的地理環境優勢。但我們從表格中可以分析到:該地區對于酒店客戶數據的分析很大程度上都是運用在了報表制作當中,對于市場及客戶方面的工作少之又少。除卻相對高端的五星級酒店在市場開拓和客戶需求查詢方面做了相應的努力,但還是沒能將大數據的作用完全開發出來。

(三)酒店基本的服務設施配套不夠全面 酒店的服務除了體現在優質的餐飲方面,還在酒店客房的設計方面有著很大的要求。對于相對發達的地區而言在酒店基礎服務方面做的相對較好,但不同積層類型的酒店設備也是參差不同的。建設智慧型的酒店,不僅要在客戶數據處理方面做足功夫深入分析,在酒店服務方面也要實現智慧智能化。酒店服務管理智能化是發展的一個不斷豐富、領域。酒店作為直接面對客人提供服務的場所,應充分的考慮個人隱私、個性化的需求,以及感受到高科技帶來的舒適和便利。同時,酒店物耗、能耗、人員成本,也應考慮降到最低,創造效益。例如:智能的門禁系統、智能的取電開關、以及智能的交互視頻體系、智能的電腦網絡展示體系、和智能的信息查看體系,客人在房間內可實現天氣、航班動態、列車時刻、輪船時刻、客車時刻、市區公交、高速路況、市區路況等等,這些都是智能酒店應該必備的基礎服務。

三、大數據于智慧酒店管理進行的應對策略與行業前景

大數據本身具有數據體量巨大、數據類型繁多、價值密度低、處理速度快的特點運用與酒店行業的價值作用更是突出。它最核心的價值就是在于對于海量數據進行存儲和分析。相比起現有的其他技術而言,大數據的“廉價、迅速、優化”這三方面的綜合成本是最優的。大數據應用與酒店管理與酒店智慧化建設互為表里,借助于大數據對酒店管理行業的推動,以更好的實現酒店企業的經濟價值和社會效益。

(一)在數據信息采集方面 客戶信息數據采集是實現智慧型酒店建立的根本基礎,夯實的數據基礎在行業的規則制度、工作流程確定下才能在后期的大數據分析中實現其作用。酒店行業或是相關的政府單位可以為他們建立相應的數據采集基礎模板,前臺客服人員在進行客戶信息采集的時候嚴格按照這個模板的工作流程進行,從根本方面保證所采集信息的有效性和準確性。行業之間可以建立數據信息共享的網上資源平臺,這既方便了顧客的需求又實現了企業的經濟效益。

(二)數據分析系統的功能研究 在酒店客戶信息的有效采集基礎上,應用Tableau 這一設計軟件做相關的數據分析。主要通過對數據的總結分析以及關聯數據分析進行相關的數據分析研究。對客戶的入住信息做以分析,總結住房消費的生成規律,以開發潛在的客戶資源。

(三)在酒店住房預定方面 入住客戶通過電話預約或是網上預約的形式來實現住房預定。這是繼客戶充分了解酒店之后的又一項步驟。大數據可以更全面的分析客戶的需求和以往入住經驗總結,幫助酒店前臺服務人員為顧客推薦更合適的房間類型。

(四)在酒店顧客入住階段 客戶入住是顧客完成住房預定之后的又一項重要工作。對于首次入住的顧客來說,這是他對于該酒店進行深入了解的第一步。這一階段過程中,最重要的就是應用大數據分析顧客入住階段的顧客類型分析,以提升酒店的專業水準。在互聯網大時代背景下,顧客采取網上預定消費的群體越來越廣泛。在互聯網上進行該酒店的預定消費,從另一方面來講這也是該酒店的企業外在形象的維護階段,是品牌效力影響下的入住消費。所以更應該加強酒店的整體服務水平,為酒店吸納更多的消費者,并盡可能發展成為酒店會員。在整體顧客選擇的住房類型來看,一般顧客對于經濟房的需求量所占的比重稍大一些。說明該酒店的消費群體主要以大眾消費為主,所以在酒店管理配置方面可以加大該類型客房的建設,方便 客戶使用。在貼心周到的基礎實施服務方面,比如有帶小孩的顧客,酒店前提服務人員在進行入住手續辦理的時候可以為小孩提供玩具、家庭套房的服務,嬰兒床等配套服務設施,在整個過程中要最有先考慮顧客入住酒店的舒適感。同時,還要強調客人入住酒店的安全感,尤其是信息安全方面。但是大數據已經是未來經濟發展過程中必不可或缺的預測工具,所以酒店行業應在各方面做好準備,迎接大數據時代的到來。而且在國家的統籌規劃與政策扶持的支持下,加之各地方政府結合實際制定大數據產業發展的策略,再通過國內外IT大企業以及眾多創新企業的積極參與,大數據產業未來發展前景十分廣闊。

結束語

總而言之,酒店管理依附于大數據的應用,智慧型酒店對大數據的依賴更是與日俱增。大數據幫助酒店整合客戶信息,為酒店在顧客來源方面提供了便利,幫助實現酒店顧客消費的最大化。它不僅在酒店管理和與顧客雙方溝通方面有著至關重要的作用更實在酒店與其他合作關系方面為酒店爭取了一定的主動,改善了傳統的酒店運營和消費交易模式。通過大數據的分析,酒店能夠更為快捷的了解顧客的入住需求,在提升自身檔次的同時又實現了良好的酒店企業經濟效益。

參考文獻

[1]楊宏.大數據與智慧酒店管理[J].科技創新與應用,2015,19:259-260.

第12篇

關鍵詞:大數據;決策支持;數據分析

中途分類號:TP393 文獻標志碼:A 文章編號:1673-8454(2017)05-0051-05

隨著信息化建設的不斷推進,高校建設正由數字化校園向著智慧校園的方向邁進。信息化高度發展,給教學、科研、學習、生活帶來了高速便捷的服務,同時也長生了大量記錄高校日常管理和教學工作的數據,這些數據隨著時間的積累構成了一個龐大的大數據資源。這些資源具有很高的價值,如何讓這些數據發揮價值,為高校各項工作提供服務,是值得每一個學校思考的課題。

一、信息化發展現狀

公安教育信息化是培養高素質公安人才的根本要求,是開展教育訓練工作的實際需要,是順應公安信息化發展趨勢的必然選擇。上海公安高等??茖W校作為上海公安教育訓練工作的主陣地,在校園信息化建設方面進行了積極的探索,由數字化校園正逐步向智慧校園邁進,在服務公安教育培訓、指導公安實戰等方面發揮了重要的作用。

1.信息化基礎設施建設

自2005年啟動第一個信息化五年規劃以來,我校信息化基礎設施水平不斷提升。目前公安網和教科網兩套網絡均成熟應用,公安網成為日常辦公的主要載體,無線網絡在校內已實現了全覆蓋,廣大師生均可免費使用。此外學校率先使用虛擬化等先進技術,運行了各類實體服務器107臺、虛擬服務器289臺,以及各類信息系統102個,其中郵件系統為全市5萬多名公安民警提供服務,是上海市公安局首個面向全局民警應用的郵件系統。

2.建成公安教育云服務平臺

2011年被評為上海市10家云計算應用培育單位之一,我校開啟了公安教育云服務平臺的建設工作。在綜合考慮公安實戰及公安教育的業務需求基礎上,云平臺建設分為兩個方面,一方面是建立數據中心,將已有的物理資源、虛擬資源、數據及應用資源進行整合,形成云資源池,通過云資源管理軟件對計算資源進行統一管理;另一方面,建立虛擬云桌面,將應用封裝為各類云服務集中到云數據中心,用戶可通過多種聯網終端接入云門戶獲取相應服務。云服務平臺作為上海市經信委云計算培育項目在學校得到廣泛使用,其提供的云盤、虛擬云桌面、云應用等功能有效地解決了教學資源異地訪問受限的問題,也為未來移動教學提供了一個優秀的支撐平臺。

3.自主研發信息系統集成平臺

學校采用SOA等先進技術自主_發了信息應用系統集成平臺,將校內主要74個信息系統納入平臺進行統一管理。此外,上海公安教育訓練管理平臺作為公安行業內第一個覆蓋民警終身培訓全過程的管理系統,其16個培訓管理子系統也納入了統一的信息化流程,為上海公安每一位民警形成了一份完整的教育訓練活動電子檔案。信息系統平臺目前集成了學校80%的應用軟件,當前用戶56000人,日均在線1000人,為全局教育訓練工作提供了強有力的支撐,也成為大數據分析最重要的數據來源之一。

4.建成上海公安遠程教育網

我校率先在全國公安院校建立“上海公安遠程教育網”,通過研發網絡學習平臺、領導干部在線學習平臺、在線考試系統、在線答疑等輔助模塊,探索遠程教育應用于公安教育訓練的新模式。學校教師教官均參與到公安網絡課程、公安微課程的建設中,形成了人人有課程教學網站、時時可布置在線作業,處處可進行在線答疑的良好教學互動局面,打破了學員學習的時空限制,有效拓寬了學院獲取教學資源的渠道,使上海公安教育在使用教育信息技術方面成為全國的排頭兵。

二、信息化建設中的大數據

我校在信息化建設過程中,已部署了眾多軟件系統,如信息系統集成平臺、教學管理系統、OA辦公系統、后保綜合系統、遠程教育、數字圖書館等,這些系統每天都在產生大量數據,并且產生的速度越來越快。這些數據來源于不同的應用和層次,既有教學、科研、人事、財務、資產等常規管理型業務所產生的結構化數據,又有課件、圖片、視頻等多媒體教學資源產生的非結構化數據,同時還有購物、吃飯、洗浴等一卡通消費行為數據,以及無線網絡、RFID、GPS等物聯網感知的位置數據。這些數據在系統運行中不斷積累,目前學校各業務系統已有結構化數據表約1000多個,記錄約5千萬條,數據規模接近200G,初步積累了“公安教育大數據”。這些數據得到了有效的存儲和管理,但囿于技術限制以及數據應用經驗的不足,這些數據在分析挖掘、充分利用方面還不夠。如何利用這些數據,使這些數據變為有價值的信息和知識,為公安教育訓練工作提供決策成為擺在我們面前的一道亟需攻克的難題。

通過對信息系統和數據進行梳理,我們發現當前系統中還存在一些問題:

(1)信息孤島現象仍然存在。雖然學校的信息集成平臺集中了絕大部分管理類的應用,但是遠程教育、數字圖書館等專業應用仍有較強的獨立性,信息并為充分集中和互通,數據之間無法動態關聯,降低了數據的使用效率;

(2)技術難點需要突破。由于數據類型繁多,類型不一,傳統的數據挖掘算法無法滿足這些結構化和非結構化數據的處理要求,傳統數據挖掘技術面臨巨大的挑戰;

(3)缺乏數據分析的模式和方法,數據需求不夠強烈,數據價值難以體現。

同時為了解學校對數據服務的需求,探索大數據應用的解決方案,我們還對學校的教學部門及管理部門進行了走訪調查,聽取了各部門對信息化工作的意見和建議,并對日常教學、科研、管理等方面存在的數據應用需求進行了歸納:

(1)校辦公室提出,希望通過數據掌握學校總體運行情況,但目前無法實時了解在校培訓總人數,教室、宿舍使用率,教師教官教學狀態等,缺乏相關數據支撐,為領導提供決策支持方面工作收到較大局限。

(2)政治處要時刻掌握民警的出勤情況、人員結構、思想狀況等,但目前考勤系統還未能實現對各種出勤數據的自動統計,人事數據變動也無法做到即時的自動分析,工作人員則希望系統產生的數據可以通過統計和分析來得到有用信息從而降低人工統計的工作量,并能夠通過人員結構變化進行各種趨勢分析。

(3)教務處目前已提供了各專業課程數據、師資情況、學校教室使用分布數據、學生實習實訓等情況,工作人員希望能通過利用已有數據、分析排課規律來實現自動排課功能。學管處在現有錄入數據的基礎上,希望通過學生在??荚嚦煽?、德育表現、獲獎情況等在學員畢業前自動為每個學員形成綜合畫像。

(4)后保處表示對于學校日常管理的數據需求日漸增大,如對于能源消耗管理、車輛運行管理、經費管理等應用大數據分析,將大大提高后勤管理的工作效率。

(5)教學部門的工作人員提出希望能通過數據自動分析出網絡課程各模塊學員參與度及掌握情況,以及在線考試題目的錯誤率等,從而為網絡課程的設計提供參考,并為教學創新提供重要依據。

我校數據來源廣泛、數據類型繁多,數據量隨著信息化建設的推進日益增加?;谀壳暗臄祿F狀,以及學校各部門對于數據應用的需求,我們考慮建立公安教育大數據分析平臺,對學校人事、課程、資產、檔案等方面的數據進行收集、存儲、分析,把得出的知識再反過來服務于管理、教學、科研、后勤等各項工作,通過系統的整合以及數據的互聯、共享,提高數據的利用效率,從而推動數據在公安教育中的智能化運用。

三、公安教育大數據分析平臺的構建方案探索

我校100多個信息應用系統,在日常教學和管理中積累了大量歷史數據,但這些海量數據卻沒有得到有效的分析和利用,各部門人員在日常數據錄入和維護中只是通過統計和排序對數據進行簡單的功能操作獲得一些表面、淺顯、價值不高的結果。構建一個大數據分析平臺,從學校其他應用平臺中抽取海量數據進行管理、整合、分析和利用,從中發現潛在問題和有價值的規律,并通過可視化的方式進行展示,能夠為學校管理層提供科學決策的支持,并滿足教師教官、學員的個性化需求,從而提高我校信息化服務的質量。

1.構建目標

(1)實現數據的共享和交換。將學校各應用系統的數據進行集成和整合,使來源各異、種類不一的各類數據可以相互使用,豐富數據的來源,打破系統間的信息孤島,實現數據的共享和應用。

(2)大數據的采集和存儲。研制數據適配接口,對接校內各應用系統獲取各類異構數據,并采用大數據主流的框架和系統對數據進行統一存儲,為數據的挖掘和分析打好基礎。

(3)大數據分析與決策。采用數據挖掘、數理統計等相關技術,構建大數據分析框架,提取數據中隱含的、未知的、極具潛在應用r值的信息和規律,為學校的教務管理、科研管理、學員管理、后勤管理等各項工作提供決策和指導。

2.構建原則

(1)安全性。公安教育訓練工作中有許多保密性內容,大數據分析平臺依托公安網進行部署,應采取安全性高的訪問認證機制,同時在平臺建設中要充分重視系統自身的安全性以及其他應用系統的安全性。

(2)可擴展性。對公安教育大數據的分析和應用是一項長期持久的工作,隨著管理工作的重點、教育訓練工作的變化推進,對于分析平臺的規模和要求也會不斷變化。因此,要求平臺的設計和實施要具有良好的擴展性,以滿足不斷發展變化的要求。

(3)靈活性。在平臺的設計和實施中要考慮到與其他應用系統的整合,開發出多個類型的接口,能夠靈活接入其他系統、拓展服務類型。

3.總體框架

平臺應適應于大數據處理要求,能支持PB級數據管理。系統架構應高安全性、易擴展性,能夠支持各類主流開發語言,并提供豐富的接口。同時能夠支持結構化和非結構化數據的存儲和應用。Hadoop作為開源的大數據處理平臺和工具,其提供的HDFS分布式文件系統和MapReduce模型能夠很好地滿足以上的要求。系統的總體架構圖如1所示。

基于Hadoop技術的公安院校大數據分析平臺自下而上分為三個部分,分別為:數據層、大數據采集與存儲、數據分析及展示。

(1)數據層,針對不同系統進行分析,制定系統數據采集范圍與目標,收集本校在日常管理和教學中的產生的各類數據,將各種結構化和非結構化數據進行整合,為大數據的分析提供支撐。

(2)大數據采集與存儲旨在為各類異構數據研制適配接口,與校內其他各系統對接,并為數據提供適配、轉換、存儲等基本管理功能,基本步驟包括:

a.數據抽?。横槍Υ髷祿治銎脚_需要采集的各類數據,分別有針對性地研制適配接口。對于已有的信息系統,研發對應的接口模塊與各信息系統對接,不能實現數據共享接口的系統通過ETL工具進行數據采集,支持多種類型數據庫,如SQL SERVER, ORACLE, ACCESS等學校系統數據庫,按照相應規范對數據進行清洗轉換,從而實現數據的統一存儲管理。對于其他數據,需要具體根據數據情況實現相關接口,利用對應接口獲取相關數據信息,進而完成數據的抽取。

b、數據預處理:為使大數據分析平臺的MAPREDUCE算法能更方便對數據進行處理,同時為了使得數據的存儲機制擴展性、容錯性更好,需要把通過數據按照相應關聯性進行組合,并將據轉化為文本格式,作為文件存儲下來。

c、數據存儲:為了提升數據存儲的擴展性和容錯性,采用主流的大數據框架Hadoop的HDFS文件系統對學校的各類數據統一進行文本化存儲,數據按相應規則存儲,實現每日保存一套完整數據文件集,形成數據倉庫。

(3)數據分析和展示是核心業務層,通過數據報表工具,根據需求制定多樣的,針對性的數據報表。通過基于的Hadoop的MapReduce編程模型實現的數據分析系統,針對存儲的數據進行數據處理、算法運行、結果轉換操作,將結果保存為報表文件,每日形成的報表文件集。報表展現系統將生成的報表文件以可視化方式進行展現。

4.大數據分析平臺中的關鍵技術

大數據平臺的構建借鑒了開源系統的先進理念,采用了Hadoop開源系統,充分利用 HDFS的可靠性,MapReduce的引入大大加強了平臺在數據分析方面的彈性,使平臺在可擴展性、可靠性、易用性和性能方面都有良好的表現。

(1)Hadoop技術

Hadoop框架是一個開源的大規模數據處理平臺和工具,主要來源于Google公司提出的MapReduce編程框架,GFS文件系統以及BigTable存儲系統等技術[1]。Hadoop具有龐大的家族體系,本平臺的構建主要涉及到Hadoop框架的分布式文件系統HDFS和MapReduce模型。分布式文件系統作為Hadoop框架的底層,主要負責分析數據的分布式存和管理,MapReduce模型主要是負責對大規模數據集進行計算處理。Hadoop用HDFS文件系統子框架來實現其所具有的存儲能力,用MapReduce編程模型框架來實現其計算能力,二者的巧妙結合使得Hadoop擁有高效的存儲和計算能力。

(2)HDFS技術

HDFS分布式文件系統是對大規模數據實現分布式存儲和管理的有效工具,也是分布式計算的存儲基礎,具有很高的容錯性和擴展性,并且對數據讀寫提供了的高吞吐率[1]。HDFS實現了數據的分布式存儲,使得應用程序能夠更加靈活地訪問大規模的數據集,同時也為后續對大規模數據的分析提供了數據平臺[5]。HDFS分布式文件系統用的是典型的主/從結構,這種結構極大的簡化了系統的架構,使得系統更加簡潔,方便系統的管理。Hadoop的分布式文件系統HDFS主要由主控制器和數據節點組成,主控制器管理名字空間和數據節點,同時管理數據塊到數據節點DataNode的映射等。文件系統中的DataNode作為數據節點,主要存儲實際的數據,主要負責所在的物理結點上的存儲管理,執行主控制器下達的命令。數據節點能夠及時接收客戶發送的讀寫請求,并針對這些請求完成相應的操作。從分布式文件系統的結構內部來看,數據文件被存儲分割成多個數據塊存儲在每個數據節點上,每個數據節點存儲著來自多個文件的數據塊,同時每個數據節點上也會存儲這些數據塊的多份副本,保證后續數據操作的準確性。

(3)MapReduce技術

MapReduce技術基于分布式文件系統,通過編寫相應的處理過程能夠實現對大規模數據集進行并行計算和處理,通過對不同分析模塊編寫相關的MapReduce處理函數能夠實現對大規模數據的精確分析,同時能夠控制各個節點之間完成高效的任務調度[5]。MapReduce通過將操作分發給網絡上的各個節點,每個節點會周期性的返回它所完成的工作和最新的狀態,從而實現對大規模數據集的操作,這種處理方式保證了操作的可靠性[5]。MapReduce技術處理的方式是,首先將一個具體的任務分解成為若干個很小的任務,然后將分解后的任務分配到各個分節點,通過主節點來對分節點的任務進行管理和調度,然后得到分節點處理后的結果,再將結果整合,得到最終結果,通過多個節點之間的相互合作和調度,從而實現對大規模數據集的計算和處理??偟恼f來,MapReduce就是基于“分而治之”的思想實現“任務的分解與結果的匯總”。

四、利用大數據,實現教學和管理的全面創新

構建公安院校大數據分析平臺是以我校戰略發展規劃為藍本,以我校信息化建設綱要為依據而進行的創新性探索。以大數據建設頂層設計為基礎,收集整合公安教育各方面所產生數據,從數據中提取出有價值的信息和模型,推動公安教育的全面創新。

1.開展大數據頂層設計,以大數據應用全面推進學校發展

大數據將成為推進學校發展的新動力,通過開展大數據頂層設計,對大數據獲取、收集、整理、利用進行全面規劃,從應用需求出發,明確建設目的和路徑,明確什么要做,什么不要做,什么應該先做,什么應該后做,用什么模式做,做到什么程度,達到什么效果,以指導學校未來3-5年的大數據建設。

2.快速推進教學和管理工作的信息化,建立豐富的數據來源

用大數據方法全面分析現有教學和管理工作,新建或升級信息系統,對教學和管理實現全過程記錄,建立豐富的數據收集渠道。如通過對現有遠程教育系統進行全面升級,跳出遠程教育的概念,實現對教學過程的全面支持,詳細記錄每個學生的學習行為數據,包括課程學習數據、視頻觀看數據、資料查閱數據、作業完成數據、互動交流數據、成績數據等,將數據細分到每個行為細節,以提供超越傳統系統的數據精細度,客觀地反映出學習的實際狀況。通過建立物聯網應用,實現對物品、人員、安全等各方面管理的強大支撐,提升管理質量的同時積累大量管理數據和行為數據。

3.基于個性化服務需求,建立大數據分析模型

提供優秀的個性化服務是教育和管理的重要目標之一,大數據應用則是提供規模個性化服務的必要條件,而大數據分析模型的質量決定了數據的價值。一個平時被忽略的數據在好的模型中,會產生難以想象的作用。我們可以通過對學習行為數據的分析,了解學生的學習興趣和學習效果,研究哪些學習方式是最容易被接受的,哪些課程的設計是最受歡迎的,或具體到某個作業問題回答的正確率以及橫向和縱向的比較,并深層次的展現出其中的原因。這些數據被提供給教師,將對教學創新提供最為直接的支撐。通過對一卡通行為數據的分析,可以了解學生的日常行為規律和消費規律,了解學生行為與學習成績、學校效果之間的關聯關系,提供學生管理創新的依據。

4.綜合應用大數據成果,推動學校全面創新

通過大數據的綜合應用,可以建立對各項教育和管理工作的分析和判斷,應用到實際工作中,從各個方面推動學校全面創新。

通過對教學過程、學習行為、學習成績、教學滿意度、教師需求量、專業師資質量、專業成熟度、行動軌跡等綜合分析,建立教師畫像、學生畫像、專業畫像,直觀了解優勢和不足,預測發展狀況。

通過對學生人數、宿舍分配、教室使用、能源消耗、網絡消耗、食堂消費、圖書館利用等進行綜合分析,建立各資源利用率指數,實現數據可視化,引導管理工作的精細化和管理的扁平化。

通過對一卡通、圖書借閱、專業分布、課程分布、成績、學習行為等進行聚類分析,發現具有某些特征的特殊群體及其獨有的行為方式,并利用相關性數據進行挖掘,從中發現規律。

通過對教學數據、教學效果、考勤記錄、個人數據、管理數據進行綜合分析,建立科學的、真實客觀的教師績效評價體系,改變傳統人為評價的主觀性,讓大數據選出真正優秀的教師。

五、結語

構建高校大數據分析平臺是個具有開拓性的實踐探索,在高校中具有廣闊的應用前景。我校目前還處于初步規劃的階段,我們將加強與行業公司、科研機構的合作,在大數據分析平臺構建方面進行深入探索,從公安教育信息化發展的實際出發,采用當前先進的工具和技術,構建出體現上海公安教育特色,同時在普通高校又具有通用性的大數據分析平臺。

參考文獻:

[1]趙剛.大數據:技術與應用實踐指南[M].北京:電子工業出版社,2013:4.

[2]周飛,石晉杰,崔磊.“大數據”時代的公安工作初探[J].上海公安高等??茖W校學報,2013,23(2):34-37.

[3]宓,趙澤宇,大數據創新智慧校園服務[J].中國教育信息化,2013(24): 3-7.

主站蜘蛛池模板: 安化县| 花莲县| 汝南县| 沂南县| 洛川县| 惠东县| 信宜市| 名山县| 兴仁县| 改则县| 久治县| 六枝特区| 翼城县| 延津县| 大田县| 邵武市| 于都县| 五莲县| 双鸭山市| 武强县| 托克逊县| 岳池县| 龙南县| 张掖市| 石泉县| 贵阳市| 天柱县| 富源县| 祥云县| 东乡县| 呼和浩特市| 句容市| 玉林市| 赤峰市| 枞阳县| 鄂温| 宁远县| 绥芬河市| 红桥区| 宣化县| 灵川县|