真人一对一直播,chinese极品人妻videos,青草社区,亚洲影院丰满少妇中文字幕无码

0
首頁 精品范文 加工合同論文

加工合同論文

時間:2022-06-25 23:34:09

開篇:寫作不僅是一種記錄,更是一種創造,它讓我們能夠捕捉那些稍縱即逝的靈感,將它們永久地定格在紙上。下面是小編精心整理的12篇加工合同論文,希望這些內容能成為您創作過程中的良師益友,陪伴您不斷探索和進步。

加工合同論文

第1篇

關鍵詞:數據素養;科研工作流;科研數據生命周期

中圖分類號: G254.97 文獻標識碼: A DOI:10.11968/tsyqb.1003-6938.2016085

Core Competencies of Data Literacy Embedded in Research Workflow and Data Lifecycle

Abstract The research work flow processes and general research data lifecycle are summarized at first, and then research status of data literacy core competencies is investigated and several representative core competencies frameworks are analyzed, and finally core competencies framework of data literacy around research work flow processes and research data lifecycle are built.

Key words data literacy; research workflow; research data lifecycle

1 引言

大數據時代的到來正在改變21世紀公民的素養格局,尤其是數據密集型第四科研范式下,具備良好的數據素養和熟練的數據技能已成為研究群體開展研究工作的重要能力保障[1]。然而,實踐工作中龐大的數據量和復雜的數據管理問題使得研究人員面臨嚴峻挑戰,為適應數據驅動的新型研究環境,應對科研實踐中的各種數據問題,培養研究人員的數據素養能力勢在必行。那么數據素養是什么?M.Schield[2]認為數據素養是根據科研需求在不同數據源中獲取、操作和總結數據,并從中推斷結論的一種能力;J.Qin和D.Ignazio[3]認為數據素養是“研究者在科研過程中收集、處理、操作、評估和利用數據的能力”;P.Calzada和 M .粵憶.Marzal[4]認為數據素養“包含個人獲取、理解、批判性地評估和管理數據的能力,并在使用數據的過程中遵守道德規范”。總體而言,數據素養強調的是一種正當地發現和獲取數據、批判地選擇和評估數據、規范地管理和處理數據、合理地利用和共享數據的意識和能力。

目前,國內外學者已就數據素養能力體系展開探索,并積累了一定的成果和經驗,主要集中在三個方面:一是從數據素養的概念和內涵出發,梳理數據素養包含的各種能力,如J.Qin[3]、郝媛玲和沈婷婷[5]等;二是圖書館員在長期從事科研數據管理服務的基礎上,概括和總結數據管理過程中所需的技能,如Carlson.J[6]、A.L.Ogier[7]等;三是從數據素養的上位類概念信息素養出發,在信息素養能力標準中提取數據相關的能力,如C. P.Javier 和M.粵憶. Marzal[4]等。然而,從研究項目啟動之初的數據產生、項目實施中的數據處理和分析到項目結題時基于數據得出研究結論、發表科研成果,再到后續研究中對數據的二次開發和利用,科研數據已成為科學研究工作的基本單元滲透到科研工作流的各個環節,數據素養與科研工作流、科研數據生命周期密不可分。因此,構建嵌入科研工作流、圍繞科研數據生命周期的數據素養能力框架,對于更好地培養研究人員的數據意識和數據管理技能具有重要意義。基于此,本文從科研工作流和數據生命周期的一般流程出發,調研了數據素養核心能力研究現狀,整理并分析了國內外學者提出的幾種典型的數據素養核心能力體系,梳理并歸納了嵌入科研工作流和數據生命周期的數據素養核心內容體系,繪制研究人員應具備的數據素養技能流程圖,以期為衡量研究人員的數據素養能力和探索數據素養教育實踐提供參考和建議。

2 科研工作流與數據生命周期

數據從收集(或形成)、加工、保存、傳播、檢索、存取與利用,到消失或不再被利用的過程,就是數據的生命周期[8]。隨著科技的發展和時代的快速進步,有些數據永久地休眠,再也得不到利用;而很大一部分數據卻只是進入了暫時的休眠狀態,它們將來可能會根據人類的需要再次被激活和更新,進入下一個“生命周期”,周而復始,生生不息。在數字科研環境下,“生命周期”不同于產生到消亡的“生命期”,它是一個循環過程,經過數字資源管理和長期保存,實現數字資源發現和再利用[9]。在科研實踐過程中,處于生命周期不同階段的數據具有顯著差異,不論是數據的類型格式還是內容含義,亦或數據的量級特性,均不可一概而論。正確認識科研數據生命周期,把握生命周期各個階段的數據特性,培養良好的數據素養能力,是實現科研數據規范管理和發揮數據價值最大化的前提和基礎。

目前,科研工作流與數據生命周期已得到業界的廣泛重視,英國聯合信息系統委員會(JISC)、美國地質調查局(USGS)等國家組織委員會,英國數據管理中心(DCC)、英國數據檔案(UKDA)、地球數據觀察網絡(DataONE)等數據管理專業機構以及弗吉尼亞大學、阿爾伯塔大學、昆士蘭大學等學術研究機構紛紛就科研數據生命周期展開探索研究,建立科研工作流與數據生命周期模型,以規范和指導數據管理工作的正常開展。

為深入了解科研實踐的具體流程,筆者選取了國際上較典型的科研數據生命周期進行剖析,以總結和梳理科研工作流和數據生命周期的一般流程。8種模型具體為:英國高等教育、繼續教育和技能培訓提供研究支撐的英國聯合信息系統委員會(JISC)[10];英國專門負責大型社會和經濟數據的采集、監管并提供數據訪問與獲取的專業機構英國數據檔案(UKDA)[11];世界領先的數字信息管理中心英國數字內容管理中心(DCC)[12];世界上最大的社會科學數據中心美國校際社會科學數據共享聯盟(ICPSR)[13];地球環境科學領域的數據管理專業組織地球數據觀察網絡(DataONE)[14];專注于統計數據和社會科學數據描述的國際標準協會數據文檔倡議聯盟(DDI)[15];美國弗吉尼亞大學圖書館[16];加拿大阿爾伯塔大學圖書館[17](見表1)。

筆者在分析梳理國外典型科研工作流與數據生命周期模型的基礎上,結合國內研究實踐,繪制了嵌入科研工作流的科研數據生命周期一般流程(見圖1)。除了項目啟動、項目實施和項目結項三個核心階段外,還包括項目啟動前的研究構想以及項目結束后的后續研究。科研數據生命周期的一般流程包括八個階段,分別是數據管理計劃、數據產生與收集、數據管理與組織、數據處理與分析、數據存儲、數據發表與共享、數據發現與獲取、數據再利用,各個階段環環相扣,緊密相連。下文將以此為基礎梳理和構建圍繞科研工作流和數據生命周期的數據素養能力框架。

3 數據素養核心能力研究現狀

能力標準為圖書館服務開展和各級各類教學提供了明確的目標和方向,也為各個機構的課程設計提供了基本的框架和指南[18]。數據素養是信息素養的子集,目前,信息素養領域已建立了較完善的能力標準體系,既有以美國、英國、澳大利亞、加拿大等區域性信息素養能力標準,又有面向中小學教育、高等教育的層級性信息素養能力標準,以及大眾傳播學、人類與社會科學、護理學、科學與工程技術等以學科劃分的領域信息素養能力標準。盡管這些標準對于數據素養評估和教學有一定的參考意義,但就數據素養應用實踐而言,仍亟需數據素養能力標準或框架來衡量研究人員的數據素養能力和指導數據素養教育工作的開展。

目前,這一問題已獲得國內外學者的廣泛關注,他們從不同的角度,結合數據管理服務和數據素養教育探索的實踐經驗,構建數據素養能力體系,推動數據管理培訓和數據素養教育的發展。如美國雪城大學J.Qin等[3]對比了信息素養、數字素養和科學數據素養的不同概念,指出科學數據素養包含數據收集、數據處理、數據管理、數據評估和數據利用五個方面的技巧和能力。并以此為基礎,為學校STEM各專業本科生開設科學數據素養課程;美國弗吉尼亞理工大學圖書館為滿足學校師生的數據管理需求,A.L.Ogier等[7]圖書館員開發了數據素養課程,其教育內容模型包括八個方面:數據管理與組織、數據轉換與互操作性、數據共享與獲取、元數據與質量控制、數據科學、數據監管、數據存檔與保存、數據倫理與責任;美國印第安納大學圖書館S.Konkiel等[19]設計了包含10種能力的數據素養核心能力框架:數據管理與組織、數據格式與數據類型、數據可視化、數據質量控制、數據發現與獲取、數據分析、元數據、數據倫理、數據保存、數據復用,將數據管理素養集成到數據可視化課程中,根據學生的數據技能需求,有針對性地制定學習目標和評估方案;巴西里約熱內盧聯邦大學A.Tygel和R.Kirsch [20]基于教育學家P.Freire的素養模型定義了數據素養核心能力,包括數據讀取(數據意識、數據發現與獲取、數據收集)、數據處理(數據處理技術、數據處理工具)、數據交流(數據類型、數據格式、數據評估、數據倫理)和數據生產(數據格式、數據發表工具)四種核心能力,用以指導和規范圖書館的數據管理課程;西班牙卡洛斯三世大學P.Javier 和M.粵憶.Marzal等[4]從信息素養能力標準出發,選取美國學校圖書館員協會(AASL)制定的《共同核心州立標準》、美國大學與研究圖書館協會(ACRL)制定的《高等教育信息素養能力標準》、《科學與工程技術信息素養能力標準》、《人類學與社會科學信息素養能力標準》、《護理學信息素養能力標準》、《政治學信息素養能力標準》,梳理其中有關數據管理的內容,結合圖書館科學數據管理服務,構建了包含數據意識(什么是數據、數據背景)、數據發現和獲取(數據來源、數據獲取方法)、數據閱讀理解和評價(數據閱讀與表達、數據評估)、數據管理(數據和元數據的收集與管理)、數據利用(數據操作、數據分析、數據使用倫理)五大指標的數據素養核心能力框架;瑞士R.Schneider[21]在“全球信息素養研究與實踐的共性與挑戰”大會上指出科研數據素養和數據管理能力包括8個方面的內容,分別是數據識別、數據處理、數據計劃、數據存儲、數據保護、數據評估、數據管理、數據交流。國內學者也在構建數據素養能力體系方面取得了一定的研究成果。如上海大學的郝媛玲和沈婷婷[5]認為數據素養的核心內容包含五個方面的基本要素,分別是數據態度(數據道德觀、數據價值觀)、數據意識(主體意識、獲取意識、共享意識、更新意識、安全意識、人才意識)、數據知識(特點與類型、作用于效應、規律與規范、轉換方式、搜索方法)、數據技能(獲取、處理、利用、展示、評價、再創造)和數據倫理(法制觀念、數據安全、數據道德、知識產權),旨在為我國建立數據素養培養機制提供建議。

為了更深入展示國內外數據素養能力體系研究現狀,筆者選取了美國普渡大學圖書館研究團隊、加拿大達爾豪斯大學圖書館研究團隊和國內華東師范大學團隊構建的數據素養核心能力框架作為案例進 行詳細介紹。

(1)普渡大學圖書館

普渡大學、康奈爾大學、明尼蘇達大學和俄勒岡大學四校圖書館聯合開展數據信息素養教育項目(DIL),以Carlson.J為代表的研究團隊通過剖析ACRL《高等教育信息素養標準》,訪談調研教師和學生的數據信息素養需求,并總結地理信息學等圖書館課程經驗,構建了包含12項核心能力的數據素養框架體系:數據實踐規范、數據轉換與互操作、數據監管和再利用、數據管理和組織、數據保存、數據處理和分析、數據質量和記錄、數據可視化和表示、數據庫和數據格式、數據發現和獲取、元數據和數據描述、數據倫理與道德(見表2)。DIL項目組在該能力框架的基礎上,調研自然資源、土木工程、計算機科學等不同領域研究群體的數據需求,根據需求設計課程大綱展開針對性培訓和教育,提高研究人員的數據管理能力[6]。

(2)加拿大達爾豪斯大學圖書館

加拿大達爾豪斯大學圖書館的C. Ridsdale等[22]學者在數據管理服務經驗的基礎上梳理出科研人員在數據管理過程中所需的數據素養能力,構建了包括數據管理概念、數據收集、數據管理、數據評估和數據應用五方面的數據素養能力矩陣(見表3),擬在能力矩陣的基礎上設計數據素養課程,幫助學校師生員工提高數據管理技能。

(3)華東師范大學隆茜

我國華東師范大學的隆茜[23]在綜合國內外文獻對數據素養內涵、組成能力的闡述的基礎上,從數據意識、數據獲取能力、數據處理與分析能力、數據交流能力、數據評價能力和數據道德六個維度構建了高校師生數據素養能力評價指標體系(見表4)。并以此為基礎編制數據素養能力調查問卷,分析高校師生的數據素養能力現狀,為數據素養教育奠定基礎。

筆者對以上10種數據素養能力框架進行梳理與解析,深入剖析能力框架的構成要素,共羅列了21種數據素養技能,分別是數據意識、數據收集與創建、數據轉換與互操作、數據管理與組織、數據保存、數據處理與分析(技術和工具)、數據質量控制、數據可視化、數據類型、數據格式、數據發現與獲取、元數據、數據倫理與道德、數據評估、數據利用與復用、數據共享、數據長期保存、數據安全、數據解讀、數據引用、數據交流,各能力框架及其對應的數據素養技能(見表5),這將為本文構建科研數據生命周期的數據素養核心能力框架提供參考和借鑒。

4 嵌入科研工作流與數據生命周期的數據素養能力框架

在考察數據素養核心能力研究現狀、總結科研工作流和科研數據生命周期的一般流程的基礎上,本文梳理了嵌入科研工作流與數據生命周期的數據素養核心能力框架(見圖2)。數據素養能力框架從科研工作流出發,包括項目啟動前的數據管理計劃;項目實施中的數據產生與收集、數據管理與組織、數據處理與分析、數據存儲;項目結題時的數據發表與共享,以及項目結束后的數據發現與獲取、數據再利用等8個生命周期階段的22項數據管理能力。

(1)數據意識。數據意識是一個抽象的概念,具體來說,作為一名數據工作者,應理解什么是科研數據和為什么要管理科研數據等問題。科研數據是為了特定的目標所收集、觀測、創建、分析的信息[24]。良好的數據管理實踐包含但不限于以下優點:提高研究成果的影響力,增加數據引用率;避免重復勞動,節省時間;確保研究成果可驗證性和完整性;保證數據安全,降低數據丟失的風險;滿足資助機構和學術出版商的數據管理要求;通過數據再利用,促進新的知識發現[25]。總體而言,數據管理貫穿科研項目始終,良好的科研數據管理實踐是知識再生的基礎。規范化地管理科研數據,是確保數據長期保存和持久訪問的關鍵,也是未來數據被其他研究人員理解和復用的前提。因此,研究人員在正式著手數據管理工作之前,應具備基本的數據意識。

(2)了解數據管理和共享的政策和要求。隨著開放獲取事業的推進,越來越多的資助機構(如美國國家科學基金委NSF[26]、美國國立衛生研究院NIH[27]、美國航空航天局(NASA)[28]、英國研究理事會RCUK[29]、經濟合作與發展組織OECD[30])、期刊出版商(如Nature、Springer、Wiley、Elsevier、RSC、ACS)以及研究機構(如JISC、ANDS、牛津大學、麻省理工學院、劍橋大學、康奈爾大學)紛紛數據管理政策,要求科研人員提交數據管理計劃,規范科學數據管理流程[31]。在國內,2002年科技部牽頭建設“科學數據共享工程”,目標是整合離散的科學數據資源,構建面向全社會的網絡化、智能化的管理與共享服務體系[32]。為規范科學數據匯交和共享,2006年科技部還制定了“國家科技計劃項目科學數據匯交暫行辦法”,規定了匯交科學數據的種類及范圍、數據匯交義務人的權利與義務等[33]。期刊出版商了相應的數據政策,如《現代圖書情報技術》雜志要求從2016年起,所有投稿論文需要提交支持論文結論的科學數據,并通過適當方式供研究共同體或社會公眾共享[34]。在從事科研工作時,研究人員有必要了解并遵守相應的數據管理政策和規范。

(3)制定數據管理計劃(工具使用)。許多資助機構明確提出了數據管理計劃要求,如2003年美國國立衛生研究院數據共享政策,指出“所有向NIH申請經費在500,000美元以上的科研項目,建議但不強制提交一份數據管理說明文檔,闡述數據共享的計劃和策略,由于特殊原因不能共享的,應在說明文檔中詳細說明[27]”;2007年,英國生物技術和生物科學研究理事會要求“其資助的科研項目的申請書必須包含數據管理計劃,作為一份不超過1頁的獨立附件,簡要說明數據的管理和共享計劃[35]”;2011年,美國國家科學基金會提出“所有提交到NSF的項目申請書必須包含不超過2頁的名為《數據管理計劃》的補充文件,詳細描述該項目將如何根據NSF傳播和共享科研成果的相關政策開展數據管理工作[25]”。為此,國際數據管理組織根據數據管理要求開發了一系列數據管理計劃工具,常用的包括三種:一是面向美國資助機構要求的由加州大學數字圖書館協會等協作開發的DMP Tool[36];二是面向英國資助機構要求的由DCC開發的DMP Online[37];三是面向加拿大資助機構要求的由阿爾伯塔大學開發的DMP Assistant(曾用名DMP Builder)[38]。在申請基金項目時,選擇恰當的數據管理計劃工具制定符合資助機構要求的數據管理計劃,已成為申請基金、獲得項目資助的重要前提。

(4)數據創建與數據收集。在項目之初的數據收集階段,研究人員需要考慮是否需要創建新的數據集,或是否可以復用已有的數據源。如果需要創建新的數據,那么應考慮使用哪些工具、采用哪種方式、應用何種技術來創建和收集數據。

(5)數據發現與獲取。當確定項目需要哪些數據時,可以通過數據檢索判斷是否可以復用已有的數據,這就需要研究人員具備數據發現和獲取的技能。數據獲取的途徑很多,常規的包括數據中心、數據倉儲、機構知識庫等,如英國數據檔案中心、澳大利亞國家數據中心等國家數據中心,生物學Gen Bank、醫藥科學Dryad、地理環境科學Pangaea等領域數據倉儲,哈佛大學數據倉儲Harvard Dataverse Network、中國科學院數據云等機構知識庫等都支持數據的開放獲取。但需要強調的是,在檢索和獲取他人數據集時,應遵守數據復用和數據在分配的限制條件。研究人員在使用來自第三方的數據時,需要獲得許可訪問,在允許的范圍內使用科研數據,使用數據引用標準格式注明數據原始來源,以保證數據的完整性和真實性。

(6)數據類型。數據類型多種多樣,明確數據類型有利于高效管理數據、提高科研效率。根據數據來源劃分,可將數據分為觀測型數據、實驗型數據、仿真數據、派生或編譯數據、引用或規范數據五種類型[39](見表6)。

(7)數據格式、數據格式轉換與互操作。隨著技術的發展,研究人員在存儲數據以確保長期訪問時,應充分考慮硬件和軟件的存儲設施,選擇恰當的數據格式。如文本文件應選擇ODF格式而不是Word格式,表格文件應選擇ASCII格式而不是 Excel格式,視頻文件應選擇MPEG-4格式而不是 Quicktime格式,圖片文件應選擇TIFF或JPEG2000格式而不是GIF或 JPG格式,網頁應選擇XML或RDF格式而不是 RDBMS格式。總體而言,規范并支持格式轉換和互操作的數據格式應具備以下特點:非私有的;開放的文檔標準;被科研群體普遍使用的數據格式;計算機可讀的標準化格式,如ASCII、Unicode;非加密的;非壓縮的[40]。

(8)數據組織(命名規則、文件夾組織)。在數據完成收集后,應對數據進行規范組織,包括數據和數據集的結構化、制定文件命名規則等。數據結構化時應注意使用文件夾管理數據文件,使用具有揭示意義的詞匯來命名文件夾,使用科學的文件夾層次結構,將正在進行的數據文件和已經分析完成的數據文件分開保存,設置最高級別的訪問權限等。文件命名指采用一致性的邏輯方式對數據和數據文件夾進行命名,制定文件命名規則時,可參考以下規則:文件名稱短但具有揭示意義;日期時間使用標準格式;避免使用空格鍵;避免使用特殊字符;基于主題內容識別數據,而不是僅依靠時間和版本;如果在不同的文件中包含相同的信息,考慮分組存放;在命名中考慮版本信息[41]。

(9)數據描述與元數據。元數據是描述資源特征的結構化信息,對數據進行詳細記錄是數據集可發現和可獲取的前提。使用元數據目的是為了更好地描述數據,揭示數據的內容特征,不同的學科領域具有不同的元數據標準。如地理空間元數據標準(Content Standard for Digital Geospatial Metadata)、天文學元數據標準(Astronomy Visualization Metadata)、生態學元數據標準(Ecological Metadata Language)等,具體取決于研究項目的數據類型、數據格式和學科領域。如果現有的元數據標準不能滿足項目的數據描述需求,研究人員可創建元數據方案,包括描述性版塊、權利版塊、結構化版塊和技術信息板塊:描述性版塊即描述數據集內容的信息,如題名、日期、創建者姓名等;權利版塊包含數據歸屬權、數據的使用和訪問權限等;結構化版塊包括數據的邏輯結構、表現形式等;技術信息版塊指數據的技術特征、數據創建軟件、使用方法等[42]。元數據是規范化管理數據的基礎,是數據管理計劃的重要組成部分,在項目啟動前就應確定元數據記錄方案。

(10)數據質量控制。數據質量控制對抽樣檢查數據值的準確性進行二次數據錄入,對比檢查數據是否有誤,分組排序,查找離散值和缺失值、統計計算極端值和異常值。還可以使用OpenRefine等數據清洗工具。在數據管理計劃中還應包含數據收集的質量控制說明。包括使用的刻度標準、樣本二次采集和測量、數據采集標準、數據準入標準、數據驗證和使用的受控詞匯表等[43]。

(11)數據處理與分析(技術、工具)。在完成數據的收集和組織后,根據數據類型和預期結果選取恰當的數據分析方法對數據進行處理和分析是得出研究結論的關鍵所在。隨著數據量的劇增和數據問題的日益復雜化,研究人員在處理和分析數據時往往需要借助專業的數據分析工具,如SAS、SPSS、STATA等。此外,在進行數據建模、仿真計算時還需要研究人員掌握一定的計算機編程等技術。

(12)數據解讀。數據解讀能力主要強調認識數據的內容特征和洞察數據的實質內涵。這要求研究人員具備三方面的能力:一是扎實的專業領域知識;二是敏銳的數據分析能力;三是精準的數據表達能力。任何數據認知錯誤和表達錯誤都可能造成研究結論的巨大差異,導致嚴重后果。

(13)數據可視化。無處不在的圖像和可視化媒體正在改變21世紀的素養格局,可視化素養被視為公民的必備素養[44]。大數據環境下,利用數據可視化技術形象、直觀地展示數據內容和研究結論已成為學術信息交流的重要方式。Gephi、Exhibit和Gnuplot等數據可視化軟件在科學研究中發揮著重要作用,研究人員應學習并掌握相應的數據可視化技能。

(14)數據安全與備份(數據保存環境與存儲介質)。采取數據安全措施能夠有效避免數據被不當訪問、使用、修改、傳播和破壞,數據安全的含義主要包括:一是網絡安全,確保機密數據不能上網,將敏感信息保存到不能聯網的計算機中;二是物理安全,確保重要資料存放地的安全(如保安看守),尋求可信任的人充當計算機的故障檢修員;三是計算機系統和文件安全,包括更新計算機殺毒軟件、避免使用郵件或FTP協議傳輸保密數據,在計算機和數據文件中使用密碼等加密措施;另一種確保數據安全的措施是定期進行數據備份。進行可靠地數據備份是數據管理實踐的重要環節。定期數據備份能夠有效規避數據丟失、數據損壞、病毒或黑客破壞、停電、軟件損壞以及其他人工錯誤。建議對數據進行三份備份,即原始數據、原始數據在本地的備份、原始數據在遠程設備上的備份[45]。

(15)數據版本控制。版本控制是對數據處理不同階段的數據進行標識的過程。它能夠對數據的處理流程進行跟蹤,標識哪個是草案,哪個是修訂以及哪個是最新的版本。能夠有效避免數據的混亂,尤其是研究小組的人員同時對數據進行處理時。總的來說,版本控制的優點包括可追溯性、可識別性、清楚明晰、減少重復、減少錯誤等。版本控制一般通過對文件命名來體現,此外還可使用版本控制表,即對文件進行操作修改時,填寫文件版本的修訂情況,包括新版本的序號、修改人、修改目的、修改日期等[46]。

(16)數據保存(短期保存和長期保存)。數據保存是數據管理流程的關鍵步驟,不僅指項目結題后的數據存檔,還包括項目進程中數據分析與處理等階段的數據保存。在項目期間需要短期地保存數據時,應注意數據類型與格式、數據存儲介質與遷移、數據備份與安全等問題;在制定數據管理計劃時應明確提出項目結題后的數據長期保存方案,具體包括數據存儲地點(如公共數據中心、領域數據倉儲、機構知識庫)、數據保存內容、數據保存時間、數據保存介質、數據保存成本、敏感隱私性數據存儲策略等方面的問題。

(17)數據遴選與評估。數據保存面臨著高昂的數據保存費用、需要花費更多的勞動和精力、在良莠不齊的海量數據中進行檢索和查詢使得數據發現變得更加困難等挑戰,并不是所有的數據都需要保存。因而,制定數據存儲策略時應遴選和評估數據,即確定哪些數據需要存儲,哪些數據需要被銷毀和刪除,評估數據是否具有未來的利用價值。在遴選和評估數據時,可根據以下問題進行判斷:資助機構和學習要求保存什么數據?數據對于研究項目和機構而言是否具有重要價值?數據中是否涉及知識產權和相關倫理問題?是否對數據進行充分描述?是否能夠支付數據保存費用?

(18)數據發表。目前,科研數據發表主要有三種形式:一是科研數據獨立發表:將科研數據集作為獨立的數字對象存儲在數據倉儲或數據中心,支持數據的發現、獲取和再利用;二是發表數據論文,在數據論文中描述數據集的內容及其相關信息,將數據到專業數據期刊中,原始數據集存儲在期刊出版商或其指定的數據倉儲中;三是數據作為期刊論文的補充材料發表。在論文中注明數據來源及獲取方式,根據論文與數據之間的關聯獲取原始數據,支持研究結論驗證,防止學術不端[47]。其中,將數據作為期刊論文的補充材料發表是最普遍的數據發表形式,分兩種情況:第一,時將相關數據存儲到數據倉儲中,通過DOI等數據唯一標識符與論文創建關聯;第二,數據作為論文的補充材料同論文一并提交到期刊出版商。了解數據發表的不同形式,并基于實際需求選擇恰當的數據發表方式,是研究人員傳播學術成果、獲得學術聲譽的基本常識。

(19)數據共享與許可協議、數據訪問權限。在共享數據時設置數據訪問權限、選擇適當的數據許可協議是保障數據創建者權益的重要手段。共享的數據涉及商業機密、敏感信息和隱私內容時,可以設置數據庫或數據倉儲的數據訪問權限,通過密碼等方式控制數據的訪問,同時保證數據的可發現性和可訪問性。數據使用權限主要通過數據許可協議體現。目前使用較廣泛的是Open Data Commons[48](分為PDDL、ODC-By、ODC-ODbL三種級別)和Creative Commons[49](分為BY、NC、ND、SA四種級別)制定的數據許可協議。創建者根據數據開放需求選擇恰當的數據許可協議,數據使用者遵守相應的數據使用規范,能夠有效避免數據知識產權糾紛等法律問題,促進數據開放共享環境的健康有序發展。

(20)數據共享的倫理問題。數據共享的倫理問題主要體現在數據的隱私性、敏感性和保密性。社會科學、生物醫學等領域的項目往往包含人類或動物的隱私信息,或是能夠識別個人信息的敏感數據。凡是涉及人類受試者或瀕危動物信息的研究項目需通過倫理審查方可實施。也就是說,在開展調查前,需獲得受試者的知情同意;在數據處理和分析時,應采用匿名化處理等方式保護受試者的信息不泄露;在共享數據時,需要獲得受試者的數據共享知情同意許可,也可以限制數據共享的范圍和對象來保護受試者的隱私信息。此外,涉及商業機密、專利信息、尚未發表的論文數據,以及公開將導致不良后果的敏感數據(如信息)等也是屬于數據倫理不宜公開的范疇。

(21)數據共享的法律問題。首先是數據的知識產權和版權問題。英國、澳大利亞等國認為數據知識產權賦予數據創建者處理數據的權利,即允許其他研究者做什么和不能做什么,而中美等國認為數據作為事實材料不受知識產權的保護,而使用儀器設備、花費時間成本和資源成本來收集、處理、分析數據,這種原始的數據集可被視為知識產權保護的范圍;其次是數據的歸屬權問題。一般而言,研究人員在職務崗位或利用機構環境所產生的數據歸屬于本機構而非數據創建者。此外,數據共享的法律問題還包括合同、協議規定的其他具體問題。

(22)數據引用。隨著數據集被視為一種獨立的科研成果,數據引用也隨之成為衡量學術影響力的重要指標。對于數據生產者而言,數據引用指標與傳統文獻引用一樣,是對數據生產者研究工作的肯定和支持,代表學術貢獻和學術聲譽;對于數據利用者而言,規范化的數據引用有利于準確查找數據,更好地理解數據和獲取數據,進而促進新的知識發現。數據引用的構成要素包括但不限于:數據創建者、數據集名稱、出版年、出版商、可用性和訪問情況(如URL或DOI)。不同的數據倉儲、期刊出版商和組織機構具有不同的數據引用格式,如DataCite的數據引用格式為:創建者(年):標題.出版商.標識符[50]。在進行數據引用時,應先了解具體的數據引用標準格式。此外,EndNote等文獻管理軟件也添加了數據引用功能,可以直接創建數據集引用格式。

5 結語

數據素養除了強調數據意識的樹立和數據知識的了解外,更重要的是掌握一系列可操作的數據技能集合,涉及從數據產生與收集、數據分析與處理、數據發表與共享到數據再利用的科研數據生命周期全過程,而數據生命周期又與科研工作流密不可分,嵌入項目啟動、項目實施、項目結題的各個環節。因此,構建圍繞科研工作流和數據生命周期的數據素養能力體系對于科研數據管理服務開展和數據素養教育實施具有重要意義。本文在調研國內外數據素養能力體系研究現狀、分析數據素養能力框架研究成果的基礎上,圍繞科研數據生命周期八個階段構建了包含22項能力的數據素養核心能力框架。如有疏漏,敬請業界前輩批評指正。未來將基于此框架調研不同研究群體的數據素養能力現狀,設計嵌入研究過程的數據素養教育模式,培養研究群體的數據意識和數據管理能力。

參考文獻:

[1] Koltay T.Data literacy for researchers and data librarians[J].Journal of Librarianship and Information Science,2015:096100

0615616450.

[2] Schield M.Information literacy,statistical literacy and data literacy[J].IASSIST Quarterly,2004,28(2/3):6-11.

[3] Jian Q,D’Ignazio J.Lessons learned from a two-year experience in science data literacy education[C].31st Annual IATUL Conference.Purdue University,2010.

[4] Calzada Prado J,Marzal M粵憶.Incorporating data literacy into information literacy programs:Core competencies and contents[J].Libri,2013,63(2):123-134.

[5] 郝媛玲,沈婷婷.數據素養及其培養機制的構建與策略思考[J].情報理論與實踐,2016,39(1):58-63.

[6] Carlson J,Fosmire M,Miller C C,et al.Determining data information literacy needs:A study of students and research faculty[J].portal:Libraries and the Academy,2011,11(2):629-657.

[7] Ogier A L,Lener E,Miller R K.The data literacy advisory team at virginia tech:Developing a content model for data lteracy instruction[EB/OL].[2016-04-30].http://docs.lib.purdue.edu/cgi/viewcontent.cgi?article=1054&context=dilsymposium.

[8] 張靜波.大數據時代的數據素養教育[J].科學,2013,65(4):29-32.

[9] 肖瀟.基于數據生命周期的科學數據服務模式研究[D].北京:中國科學院研究生院,2012:16.

[10] The research lifecycle[EB/OL].[2016-04-30].https://jisc.ac.uk/guides/implementing-a-virtual-research-environment-vre.

[11] Research data lifecycle[EB/OL].[2016-04-30].http://data-archive.ac.uk/create-manage/life-cycle.

[12] DCC curation lifecycle model[EB/OL].[2016-04-30].http://dcc.ac.uk/resources/curation-lifecycle-model.

[13] The data life cycle[EB/OL].[2016-04-30].http://icpsr.umich.edu/files/ICPSR/access/dataprep.pdf.

[14] Best practices[EB/OL].[2016-04-30].https:///best-practices.

[15] DDI data lifecycle[EB/OL].[2016-04-30].http:///training/why-use-ddi.

[16] Research data management[EB/OL].[2016-04-30].http://guides.library.vcu.edu/data.

[17] Humprey C.e-Science and the Life Cycle of Research[EB/OL].[2016-04-30].http://datalib.library.ualberta. ca/~ humphrey/lifecycle-science060308.doc.

[18] Association of College and Research Libraries.Working Group on Intersections of Scholarly Communication and Information Literacy.Intersections of scholarly communication and information literacy:creating strategic collaborations for a changing academic environment[M].Association of College and Research Libraries,2013:28.

[19] Konkiel S,Marshall B,Polley D.Integrating data management literacies with data visualization instruction a one-shot workshop[EB/OL].[2016-04-30].http://docs.lib.purdue.edu/dilsymposium/2013/posters/3/.

[20] Tygel A,Kirsch R.Contributions of Paulo Freire for a critical data literacy[EB/OL].[2016-04-30].http://.br/wp-content/uploads/2015/02/Contributions-of-Paulo-Freire-for-a-critical-data-literacy.pdf.

[21] Schneider R.Research data literacy[C].European Conference on Information Literacy.Springer International Publishing,2013:134-140.

[22] Ridsdale C,Rothwell J,Smit M,et al.Strategies and Best Practices for Data Literacy Education[EB/OL].[2016-04-30].http:///wp-content/papercite-data/pdf/data_literacy.pdf.

[23] 隆茜.數據素養能力指標體系構建及高校師生數據素養能力現狀調查與分析[J].圖書館,2015(12):51-56,62.

[24] What is research data?[EB/OL].[2016-04-30].http://guides.library.yale.edu/content.php?pid=324929&sid=2665407.

[25] Data management[EB/OL].[2016-04-30].http://libraries.mit.edu/data-management/.

[26] Dissemination and Sharing of Research Results[EB/OL].[2016-04-30].http://nsf.gov/bfa/dias/policy/dmp.jsp.

[27] NIH Data Sharing Policy[EB/OL].[2016-04-30].http://grants.nih.gov/grants/policy/data_sharing/.

[28] NASA Data&Information Policy[EB/OL].[2016-04-30].http://science.nasa.gov/earth-science/earth-science-data/data-information-policy/.

[29] RCUK Common Principles on Data Policy[EB/OL].[2016-04-30].http://rcuk.ac.uk/research/Pages?/DataPolicy.aspx.

[30] OECD Principles and Guidelines for Access to Research Data from Public Funding[EB/OL].[2016-04-30].http://oec

/sti/sci-tech/38500813.pdf.

[31] Funding Agency and Data Management Guidelines[EB/OL].[2016-04-30].https://lib.umn.edu/datamanagement/funding.

[32] 科學數據共享工程[EB/OL].[2016-04-30].http:///index.php.

[33] 國家科技計劃項目科學數據匯交暫行辦法(草案)[EB/OL].[2016-04-30].http:///fagui.php.

[34] 現代圖書情報技術.支撐數據提交要求[EB/OL].[2016-04-30].http://.cn/Jwk_infotech_wk3/fileup/1003-3513/NEWS/20160408165409.pdf.

[35] BBSRC data sharing policy[EB/OL].[2016-04-30].http:// bsrc.ac.uk/web/FILES/Policies/data-sharing-policy.pdf.

[36] DMP Tool[EB/OL].[2016-04-30].https:///.

[37] DMP Online[EB/OL].[2016-04-30].http://dcc.ac.uk/dmponline.

[38] DMP Assistant[EB/OL].[2016-04-30].https://assistant.portagenetwork.ca/.

[39] Data types & file formats[EB/OL].[2016-04-30].http://data.library.virginia.edu/data-management/plan/format-types/.

[40] Managing research data[EB/OL].[2016-04-30].https://data.bris.ac.uk/.

[41] Data management support for researchers[EB/OL].[2016-04-30].http://gla.ac.uk/services/datamanagement/.

[42] Research data management[EB/OL].[2016-04-30].http://library.uoregon.edu/datamanagement.

[43] Strategies for sharing your data[EB/OL].[2016-04-30].http://data.research.cornell.edu/.

[44] A practical guide to ACRL’s Visual Literacy Competency Standards[EB/OL].[2016-04-30].http:///news/member-news/2016/03/practical-guide-acrl-s-visual-literacy-competency-standards.

[45] Research data[EB/OL].[2016-04-30].http://bath.ac.uk/research/data/.

[46] Research data Management[EB/OL].[2016-04-30].http://data.cam.ac.uk/.

[47] 陳秀娟,吳鳴,胡卉.嵌入科研工作流的圖書館數據管理服務――以化學學科為例[J].圖書館論壇,2016,36(3):49-55,102.

[48] Open Data Commons[EB/OL].[2016-04-30].http:///licenses/.

[49] Creative Commons[EB/OL].[2016-04-30].https:///.

主站蜘蛛池模板: 南部县| 卢湾区| 潮州市| 正蓝旗| 垣曲县| 抚顺县| 洪洞县| 新昌县| 阿鲁科尔沁旗| 府谷县| 古蔺县| 滁州市| 保山市| 色达县| 东兰县| 乌鲁木齐市| 临西县| 武山县| 敖汉旗| 民和| 沙洋县| 乌兰察布市| 北宁市| 平陆县| 社旗县| 信丰县| 行唐县| 政和县| 礼泉县| 德庆县| 六安市| 榆林市| 永定县| 周至县| 大方县| 保康县| 西乡县| 开化县| 芜湖市| 清新县| 呼图壁县|