時間:2023-06-21 08:55:45
開篇:寫作不僅是一種記錄,更是一種創造,它讓我們能夠捕捉那些稍縱即逝的靈感,將它們永久地定格在紙上。下面是小編精心整理的12篇信息分類標準,希望這些內容能成為您創作過程中的良師益友,陪伴您不斷探索和進步。
論文關鍵詞:統計信息;分類編碼;空間信息系統;信息基礎數據庫
信息分類編碼是信息存儲、處理、交換及共享的基礎…。農村社會經濟統計各種專題數據庫應用系統雖已先后建成,但有關信息采集、處理與共享的技術標準的制定相對為滯后。對信息進行分類能夠使信息系統條理清楚,易于管理,并能夠方便地從中提取不同類型的信息加以分析利用。而采用信息分類編碼是解決信息分類問題的有效方法。
自從開展信息分類編碼標準化工作以來,一直沒有適合自身業務特點的農村社會經濟統計信息分類編碼標準。因而迫切需要進行農村社會經濟統計信息的分類與編碼,以滿足各有關方面對信息資源共享的需求。如何建立起一個可供統計各部門統一使用的國家產品分類編碼標準體系,以實現信息管理的標準化,最終實現信息的共享,已成為統計信息標準化工作的一項十分緊迫的任務。農村社會經濟統計信息分類編碼標準化是統計信息標準化工作的一個專業領域,是統計信息化過程中的一項富有挑戰性的基礎工作。建立一個完善的農村社會經濟統計信息分類編碼體系,對農村社會經濟統計基礎數據庫建設、信息共享和各類應用系統建立都至關重要。
1統計信息分類編碼概念
分類編碼是指把研究對象按各自的特征、特性進行分類,并按一定的規則編排成數字碼或數字、字母混合碼的過程。統計指標編碼就是根據統計指標分類,將統計指標賦予一定規律性的易為計算機識別和處理的一組有序符號排列。農村社會經濟統計信息分類編碼就是用字符(數字、字母或符號)對不同的行政級別分屬不同類別的統計指標進行分類,并按照不同的類別形成特定的規則和依據。
2統計信息分類編碼原則
2.1分類原則我國已經開展了大量的農村社會經濟統計工作,各類統計信息內容廣泛,但是還沒有形成一個統一的信息化的分類與編碼,現有數據的檢索、處理、分析和信息服務等存在困難,不能滿足當前綜合指標檢索、分析、處理的要求,根據農村社會經濟統計信息處理的實際需要,制定如下的分類原則:①分類的結構采用層級結構,逐級展開形成完整的分類體系;②分類要包括所有主要農村社會經濟統計指標類型,適合各種檢索、處理需要;③分類要保持統計指標體系的相對完整;④分類要處理好指標層次與指標分組的關系,加強分類的完備性。
2.2編碼原則根據國標《標準編寫規則》第3部分信息分類編碼(GB/T20001.3-2001),結合農村社會經濟信息的特性,將信息按如下原則分類與編碼。①科學性、系統性。以適合現代計算機、數據庫以及應用和管理為目標,按照農村社會經濟信息的屬性或特征進行科學分類,形成系統的分類體系。②穩定性。分類體系以各要素最穩定的屬性或特征為基礎,能在較長的時間內不發生重大變化。③完整性和可擴展性。分類既要反映要素的屬性,又要反映要素間的相互關系,應具有完整性。農村社會經濟統計信息的分類編碼工作是一項較為復雜的系統工程,要包含所有主要的農村社會經濟統計指標。④規范性。分類名稱盡量沿用習慣名稱,有國標則遵循國標,避免概念混淆。⑤唯一性。保證1個編碼對象僅賦予1個代碼,1個代碼只反映1個編碼對象。
3農村社會經濟統計信息分類與編碼方法
3.1分類方法信息分類的基本方法有線分類法、面分類法、混合分類法3種。基于統計信息的特性,農村社會經濟統計信息分類采用線分類法(也稱層次分類法),是將初始的分類對象按所選定的若干個屬性或特征,逐次地分成相應的若干個層次的類目,并排成一個有層次的、逐級展開的分類體系。線分類法層次性好,能比較好地反映類目之間的邏輯關系,實用方便,既符合手工處理信息的傳統習慣,也方便計算機的運行處理。
3.2分類設計根據信息分類原則,結合《全國主要產品分類與代碼》(GB/T7635-2002)、行政級別分類、《國民經濟行業分類》(GB/T4754-2002)A門類以及農業生產結構特點,將農村社會經濟統計信息分成5個等級:5個行政級別類,5個大類,10個中類,70個小類,900個細類。在數據庫結構設計中,每一層都留有足夠的空間用于類別的擴充。
行政級別類:是按照行政區劃級別進行劃分,依次為省級、市級、縣級、鄉級、村級。
大類:是依照國民經濟行業分類原則而建立的類別,依次分為種植業、林業、畜牧業、漁業和其他農林牧漁業產品。
中類:是大類中按照生物學科和農業學科基于生產實踐中種養的植物、動物劃分成若干分支的類群,如種植業下分糧食作物、蔬菜等。
小類:是中類按照生物學科和農業學科分類法細分成若干分支的類群,如果糧食作物下的小類可劃分為谷物、豆類、薯類、油料等。
細類:是小類中細分的基本單位,也是各級單位的起點,即物種(簡稱“種”),如具有北方特色的谷物主要有玉米、谷子、高粱等等。
3.3編碼規則編碼規則是分類編碼體系的具體表現形式,它是根據統計數據的各種屬性特征來規定編碼的每一位取值和對應的含義,進而約束代碼的制定。編碼要反映出其對應統計數據的屬性和主要特征,以區分不同統計信息的類別。
4分類編碼實例
農村社會經濟統計信息編碼設計首先確定編碼對象。例如編碼A01的對象是種植業下的糧食作物。其次建立編碼、分層和各碼位的規范取值規則,對每一編碼對象制定碼長。農村社會經濟統計信息分類采用9位編碼,分6個層次。第1層用英文字母z表示指標標識,第2層用數字1~5表示,第3層用英文字母表示,與GB/T4754—2002A門類中大類的代碼相對應,余下3層用數字01~99表示。第3層的代碼從A~E,其余3層代碼從“01”編至“99”,各碼位代表相應的類別。每一層的編碼采用數字順序編碼,動態遞增產生系列順序代碼號,隨著編碼的增加而產生新的信息類別代碼。其代碼結構見圖1。
如Z1A010101(稻谷)的結構為:z為指標標識,1為省級指標,為種植業,0l為糧食作物,01為谷物;01為稻谷。最后編制類別代碼表(后4層),對每一編碼對象按既定的編碼規則編制出該編碼的數據元素的所有取值表(表1)。
5結論與討論
[關鍵詞]優化 信息分類體系 網站
[分類號]G257 C931.6
1 引 言
好的網站信息分類體系對用戶、設計者、管理者和維護者都有利。由于網站信息分類體系往往有不一致、冗余等特點,因此需要調整、優化網站信息分類體系。優化網站信息分類體系時,方法是關鍵,但目前對網站信息分類體系優化方法的研究還很少。
網站信息分類體系優化是對網站現有信息分類體系進行調整的過程。優化網站信息分類體系時,涉及到聚類標準、大類設置、分類體系展開層次、類目種類、類目名稱、類目的均衡性和規律性、交叉關系的處理、類目排列、類目的注釋和說明、用戶的界面設計等內容。這些內容可以概括為特征、粒度、命名、結構、實現等要素。
考慮到網站信息分類體系和網站信息構建(Infor-mation Architecture,n)、網站開發關系密切,本文結合網站IA和網站開發方法提出了網站信息分類體系優化方法,并應用該方法對國家林業局網站進行了優化分析。
2 網站信息分類體系優化方法
網站IA包含了組織、標識、導航和檢索系統。網站信息分類體系是網站組織信息的手段,可以視為網站IA的組成部分。網站IA方法對網站信息分類體系優化方法有借鑒意義。學者們提出了眾多網站IA方法,雖然這些方法之間存在著差異,但它們均涉及到了分析、設計、實施(即實現)、評價等工作。網站開發也往往涉及到分析、設計、實現、測試(即評價)等工作。網站IA和網站開發方法中的評價工作主要是評價所實現的新系統,因此評價工作被設定在設計、實現等工作之后。
2.1 優化步驟
參照網站IA和網站開發的一般步驟,本文將網站信息分類體系優化工作也分為分析、評價、設計、實現等階段。為了提高網站信息分類體系優化工作的效率,本文將評價工作設定在設計、實現等工作之前,從而提出一個在設計、實現等工作之后也可以進行評價優化的信息分類體系。于是,網站信息分類體系優化時可能存在著循環、反復。本文所提出的網站信息分類體系優化方法流程如圖1所示:
2.2 優化階段
優化網站信息分類體系時,分析階段從特征、粒度(層次)、命名、結構等要素的正確性、適量性、可理解性、相關性、一致性等方面完成對現有信息分類體系的分析;評價階段完成對網站現有信息分類體系質量的評估,并根據評價結果決定是否需要優化網站現有信息分類體系;按照優化內容的不同,設計階段可以分為特征優化、粒度優化、命名優化、結構優化等環節;這些環節依次優化現有信息分類體系的分類特征、粒度關系、類別名稱、類別間關系;實現階段的任務是根據設計方案調整網站現有信息分類體系,并描述、說明優化后的體系。
2.3 優化方法
網站信息分類體系優化時,可以借鑒已有方法來完成網站信息分類體系的分析、評價和實現工作。本文借鑒文獻中網站信息分類體系的質量框架來分析現有信息分類體系,用文獻提出的指標體系來評價網站信息分類體系質量,用網站設計方法來實現網站信息分類體系的調整和描述。于是,本文中網站信息分類體系優化工作的關鍵挑戰是找到設計階段征優化、粒度優化、命名優化和結構優化等方法。
特征優化的任務是選擇最合適的特征組合,可以采用自頂向下方法優化特征。自頂向下特征優化方法是在分類模式的基礎上確定候選特征集合,再按照特征覆蓋度大小篩選出所需的特征,并對特征進行細微調整得到特征組合;粒度優化時,需要判斷粒度粗細是否合適、不同元素間的粒度是否均衡、粒子內部元素之間聚合度高不高,可以使用粗粒度優先方法優化粒度。粗粒度優先的粒度優化是指直接使用最粗的粒度關系或者基于相似度對較細的粒度進行合并、調整;為了保證用戶熟悉類別名稱,命名優化時要盡量使用通用的詞語來命名類別,可以采用基于統計的命名優化方法。基于統計的命名優化是指用統計方法選擇出現頻率高的現有體系或同類網站中詞語來命名類別。命名優化的任務還包括對錯誤類目名稱的調整;結構優化方面往往采用自底向上逐層結構優化方法來優化結構,即在確定網站信息分類體系的層數的基礎上,從最細粒度開始到最粗粒度根據類別之間的隸屬關系、類別的重要性確定類別的位置。
3 應用上述方法優化國家林業局網站現有信息分類體系
表1是國家林業局網站(forestry.省略)“生態建設”部分現有信息分類體系:
分析上述信息分類體系,可以發現它有以下特點:
?類別偏多。國家林業局網站現有信息分類體系1層所包含的第4層或第3層(沒有第4層時)的類別總數為307,而我國中央政府門戶網站(省略)和國家農業部網站(agi.省略)1層所包含的類別總量分別只有79和78。
?層數偏多而且不均衡。國家林業局網站現信息分類體系最多有4層,如“生態建設”及其子類就有4層。其中,第3層類別總數為189,有第4層子類的第3層類別占第3層類別總數不到12.2%。體系中第3層和第4層類別的名字長度和子類數量差異比較大,許多類別只有一個子類且上下級類別名稱相同(即單一子類)。不同層的類別間還有重名的現象。
?兄弟類別間關系不強。如聚合度不高,且所依據的分類特征不相同。
?現有分類體系中一些類別名稱(如“網站地圖”、“聯系我們”)的含義和通常人們理解的含義不一致,有歧義。
?現有分類體系中很多第4層或第3層類別的信息量比較少。
?現有分類體系中政務公開相關的類別偏少,無法體現電子政務網站的特點。
分析這些特點,可以發現:國家林業局網站現有信息分類體系存在著類別偏多、粒度偏細、層次偏多的問題。這使得設計現有信息分類體系時需要大量的分類標準,從而增加了網站信息分類體系設計工作的難度。進而導致了現有體系存在著名稱重復、兄弟類別之間聚合度不高、大量單一子類等問題。根據上文對現有體系的分析和文獻中對現有體系的質量評價結果,可以知道現有體系還需要進行優化。已有的分析、評價為設計工作指明了方向:可以采用減少特征、粗化粒度、減少類目數量、減少層次、減少命名歧義性、提高命名長度一致性等措施來優化國家林業局網站現有信息分類體系。
按照自頂向下特征優化方法,先確定網站信息分類體系第1層類別的候選特征集合。林業電子政務網站有主題、原型、功能、實現、對象、地域、時間、角色等分類模式。考慮到網站側重于監管、林業信息化建設相對薄弱等情況,可以以主題、原型為主要分類模式。應用主題分類模式時,從產業視角可以劃分成木材加工、經濟林果、苗木花卉、生態旅游、生物質能源等類別,從業務視角可以劃分成造林綠化、防沙治沙、自然保護等類別。應用原型分類模式時,可以劃分成文件、公告、公示等公文類別。用同樣的分析方法,可以得到業務、產業、市場、公文類別、來源、媒體、語言、技術、交互方式、可實現的任務、相關機構、相關人物、時間、地域等特征組成的候選特征集合。通過對國家林業局網站現有信息進行歸類,考慮到特征覆蓋度的大小,可以篩選出業務、資源形式、交互目的、產業等四種分類特征。另外,考慮到網站信息分類體系中有許多鏈接到獨立網站的類別,可以增加導航特征。因此,優化后的信息分類體系有業務、資源形式、交互目的、產業、導航等分類特征。
由于現有信息分類體系粒度偏細,粒度優化時的主要任務是基于相似度對現有部分類別進行合并。考慮到天然林保護、退耕還林、防沙治沙、濕地保護、公安防火等信息和自然保護有相關性,可以將它們進行歸并成生態保護;同樣原因,將義務植樹歸并到造林工作下。對現有信息分類進行命名優化時,主要是采用體系中已有詞語來命名類別,調整了部分類別名稱。對現有信息分類進行結構優化時,先確定總層數為3層,再自底向上根據類別之間的關系并兼顧類別的重要性確定類別的位置。優化后的信息分類體系邏輯結構如表2所示:
[關鍵詞] 信息組織分類主題一體化信息服務行業號百信息分類法
隨著社會信息化進程的加快,社會中存在的各種行業、產品信息不斷膨脹。這些信息在沒有被有效地組織之前猶如一盤散沙,只有對其進行科學的組織,才能夠充分發揮信息的使用價值,滿足用戶的檢索需求。
近年來信息服務行業的蓬勃發展正適應了用戶對信息組織的需求,該行業通過對社會中的各類行業、產品、知識進行有效的分類整合,建立相關索引以方便信息的查詢,從而使用戶或企業管理人員能夠快速準確地獲取相關信息,從而降低社會信息流的混亂程度,促進信息共享和信息有效訪問,提高信息產品的質量和價值。可見,信息服務行業所采用的信息組織方法是該行業發展的關鍵,對其業務開展及服務質量具有直接性的影響[1]。
1 信息服務行業的信息組織方法及問題
最初的信息分類來源于圖書館的文獻分類,隨著互聯網的迅猛發展,企業所接收和提供的信息量迅猛增長,人們對信息檢索的需求量也越來越大。分類法的應用范圍逐漸深入到各類信息服務行業中。目前,分類法在信息行業中主要應用于網站管理、搜索引擎服務、信息查詢服務等方面。該行業所采用的信息組織分類方法主要有以下幾種:
1.1 傳統分類法
傳統分類法指用于組織、整理圖書館藏書的分類法。如國外的《杜威十進分類法》、《國際十進分類法》、《美國國會圖書館分類法》等。在我國,最具代表性的傳統分類法是《中國圖書館分類法》。傳統分類法主要以文獻為主要處理對象,其分類體系為等級列舉式結構。
傳統分類法以科學分類為基礎,詞匯選取規范,具有嚴密的邏輯性與結構完整性。但同時,傳統分類法的單線型列舉式的“樹狀”結構,不能反映現代信息的多元化發展。并且,傳統分類法在表達類目、主題之間關系方面采用參見、組配、注釋等方式,對于分界模糊、交叉性強的日新月異的行業產品綜合信息也有很大的不適應性。此外,傳統分類法的專業性對于信息服務行業面對的最終用戶來說缺少易用性[2]。
1.2黃頁企業分類法
黃頁企業分類法是以分類法為核心思想并結合企業特征發展而來的一種信息組織方法,目前已被廣泛應用在企業管理和業務模塊等方面。黃頁企業分類法主要以各種企業、組織機構為對象,是將企業信息根據產品或服務的特性進行歸類后按一定方法編排的名錄[3]。
黃頁企業分類法能按專業集中地、系統地揭示企業性質,可使使用者整體清晰地把握企業特征,并且保證了高度的檢全率。但是,現代企業從事產品趨于多元化,產品之間互相滲透和綜合,因此,充分地、合乎客觀實際地反映多維性的企業性質變得越來越復雜和困難。這使得對一些企業的專業范圍很難界定,黃頁企業分類法在檢準率方面面臨著非常大的挑戰 。
1.3 人工分類法
人工分類法是以人工標引或自動標引方式采用自編的分類系統。目前大量網站和搜索引擎都采用人工分類法對網絡信息進行分類組織。這些自編的分類體系以用戶為中心,充分考慮到了最終用戶的需求特點。
與傳統分類法相比, 人工分類法通常以主題為核心建立分類,并且突出用戶關注和需求的類目,詞匯選取更加通俗易懂。此分類法最突出的特點是可以動態組織分類體系,根據需要隨時調整或組織相關資源,具有較強的靈活性和適用性。但由于分類人員缺乏專業性,且內容未經嚴格審核,隨意性較強,因此造成類目設置模糊、交叉嚴重,知識領域不全, 缺乏規范性、規律性等問題[4]。
1.4 全國主要產品分類與代碼
《全國主要產品分類與代碼》是我國于2002年頒布的產品分類標準。該分類法由可運輸產品和不可運輸產品兩部分組成,以我國工農業商品和物資為處理對象,是產品分類法的代表,對我國生產領域產品的產量、產值等各種不同類型的數據處理和準確統計提供一個分類依據。
該分類法在信息日益更新的今天并沒有及時進行動態維護管理,原標準已難以適應和滿足社會的需求。并且,該分類法僅以產品為主要處理對象,標準的覆蓋面不夠寬,無法滿足對多類型的信息進行組織的需求。
上述各種信息服務行業現存的分類體系分別以文獻信息、行業信息、產品信息為處理對象,缺乏對行業、產品綜合信息的系統完整的信息組織,并且普遍存在更新不及時、體系結構不能滿足現代信息的多元性、交叉性的問題。因此,需要從現代信息的特點出發,建立符合大眾需求的、對行業產品綜合信息進行有效信息組織的新型組織方法,以適應用戶的信息需求。
2 信息組織方法在號百公司中的應用
中國電信集團號百信息服務有限公司(簡稱號百公司)是中國電信股份有限公司的全資子公司。“號碼百事通”是號百公司的龍頭業務,是一切基于中國電信114臺的增值業務的統稱,其目的就是要在充分挖掘和整合用戶號碼信息的基礎上,延伸和拓展傳統的查號業務,滿足用戶現實和潛在的各類信息查詢需求 。
對于號百公司這樣一個信息查詢服務行業的典型代表,良好的信息組織方式是其發展的核心競爭力所在。號百公司在遵循和借鑒傳統分類法知識體系和現行的多種行業和產品分類體系的基礎上,針對號百自身的業務服務特色及用戶需求特點,設計并研制出了符合號百信息組織需求的信息組織工具――《號百信息分類法》。
2.1 《號百信息分類法》概述
號百公司所采用的信息組織方法是集“行業―產品―知識”三者為一體的綜合性、分類主題一體化的《號碼百事通信息分類法》(以下簡稱《號百信息分類法》)。它以服務機構(行業)為主要出發點,科學和實用地展示與組織相關的服務產品以及與服務產品相關的知識,同時滿足行業、產品、知識的分類組織和主題組織的需要,滿足信息服務的整序需求。
《號百信息分類法》采用了“分類―主題一體化”的編制結構,將分類法與主體法結合起來,實現對信息的內容描述和檢索功能均從分類和主題兩個角度進行,公司可以完成對行業信息的分類標引和主題標引,用戶也可以在統一的檢索系統中進行字順主題查詢和系統分類查詢。既能獨立完成主題標引的功能,滿足特性檢索的要求,又可以獨立完成分類標引的功能,滿足族性檢索的要求,從而把信息組織、信息檢索的系統性與直接性結合起來,同時建立主題詞與關鍵詞之間的關聯關系,作為主題語言與自然語言的接口。
2.2《號百信息分類法》的編制特色
2.2.1類目具有高涵蓋性《號百信息分類法》的編制遵循“具有高涵蓋能力,包括全行業和產品信息,將各類信息的行業屬性、產品屬性與知識屬性有機地融合起來”的編制原則。該分類體系的類目最細為6級,設置了34個一級類目,在一級類目之下,以行業為主要聚類依據,劃分出相對獨立的、具有市場分割性質的二級類目,形成行業的基本架構;三級類目過渡到行業、產品、知識兼顧的立類;四、五、六級類目是主要以產品、事物、知識為主的立類 。該分類體系片段如圖1所示:
由上圖可以看出,《號百信息分類法》將行業分類、產品分類和知識信息充分地綜合在一起,以便從多個角度同時滿足公司的業務開展需求及用戶的信息搜索和服務需求。此外,公司在進行行業、產品分類時,通過類目的參見及主題詞間的語義關聯建立知識間的聯系,使得行業分類與產品分類之間具有更強的緊密性和擴展性,便于用戶在檢索中便捷全面地檢索到行業及產品信息。
2.2.2分類體系的強易用性《號百信息分類法》致力于整合行業、產品的信息資源,提高廣大用戶的檢準率和檢索效率。其面向的檢索用戶并不具備專業的檢索技能及準確的分類概念。針對這一特點,《號百信息分類法》的類目體系增強易用性,相對弱化科學性。具體表現在:類目的詳細程度與檢索的信息量和查詢頻率相匹配,以滿足用戶在日常最關心的領域的信息檢索需求;注重多重列類,即在同一劃分階段,同時采用幾個標準對上位類概念進行劃分,從而獲得幾組并列的同位概念,給用戶提供盡可能多的檢索途徑;類目展開深度控制在6級,避免不具備精準檢索知識的普通大眾因類目層級過深而導致無法準確高效地找到所需信息情況的發生。
2.2.3詞匯選取從大眾出發《號百信息分類法》在詞匯選取方面充分從方便大眾的角度出發,借用豐富的入口詞提高自然語言的檢索能力,并且大量使用詞組以貼近用戶的檢索習慣。在選擇入口詞方面,收錄豐富的、對詞形規范性要求不甚嚴格的關鍵詞,在很大程度上增加了檢索入口,提高自然語言的檢索能力,從而增加了終端用戶檢索的便利性。與此同時,《號百信息分類法》在使用概念組配的同時,大量收錄了高先組度的詞組以貼近大眾的檢索習慣,在滿足信息多向成族需要的同時提高檢全率。
3 《號百信息分類法》面臨的挑戰及對策建議
《號百信息分類法》是信息組織方法在非圖書文獻領域得以應用和創新的典型代表。必須意識到,其蓬勃發展的同時仍然面臨著嚴峻的挑戰。面對分界模糊、交叉性強、更新速度快的行業信息以及多用途、交叉領域的產品信息,如何將這些錯綜復雜的數據進行有效的標引以充分揭示各類信息是個不小的難題。此外,《號百信息分類法》集“行業―產品―信息”三者為一體,在增強了分類類目的關聯性及擴展性的同時,也加大了管理人員對其維護和更新的困難性。對此,筆者試從以下3個方面提出對策建議。
3.1建立強大的參照系統,揭示知識空間的立體聯系
針對行業及產品信息錯綜交叉的特點,采取以參照系統建立的網狀關系將交叉領域的信息相結合。因此,不僅要建立交叉關系和相關概念的參照,而且需要建立不同的表示方式(如檢索詞和分類號)之間的混合參照;從同一檢索系統內的參照到多個檢索系統間的參照;從單一行業內的參照到多行業之間的參照;甚至可以在不同系統、不同行業、不同產品、不同表示方式之間建立強大的參照系統,使各類目間形成功能強大的網狀結構,從而建立和規范交叉信息之間的關系,客觀而充分地揭示知識空間的立體聯系,供用戶從不同的角度進行檢索[6]。
3.2鼓勵用戶參與,提供豐富的用戶體驗
“用戶中心”是Web2.0的重要理念。鼓勵用戶參與,提供更豐富的用戶體驗,讓用戶不止是號百信息庫的使用者,還要成為號百信息庫的建設者。針對行業及產品信息更新速度快的特點,通過與用戶的互動,充分利用群體智慧來建設號百信息數據庫。允許用戶對行業或產品記錄進行標注、評論或者更正,讓用戶真正參與到號百信息庫的建設中來。
3.3建立多維系統,提供多途徑、多類型的檢索
為了適應多元性的、交互性的、動態的網絡信息環境,可以打破分類法傳統的“線性”資源組織方式,采用分面分析的方法。在類目體系縱向展開上, 使用多維劃分和多元展開的形式為一種信息賦予多個類號, 并且可以同時設置多個類目體系, 建立多維的系統,從而提供多途徑、多類型的檢索,以滿足情報的多維檢索需要。這種多途徑的檢索方式使更多的主題概念進入分類體系, 這使得用戶可以從不同的角度進行檢索,在一定程度上大大提高了信息的檢全率和檢準率[7]。
在互聯網時代,幫助用戶高效檢索所需求信息的信息服務行業,地位不斷攀升。信息組織方法是信息服務業生存和發展的關鍵技術。信息服務業中的信息組織技術必須充分吸收傳統信息分類法的成熟理論,在此基礎上,結合信息服務的業務特色、信息用戶的搜索需求及檢索特點,才能夠使其在信息服務行業中得以有效地應用。信息服務業需要加強對信息組織的重視以提高企業的競爭力,而信息組織的方法本身也需要不斷完善和發展,以適應復雜多變的用戶搜索要求[8]。
參考文獻:
[1] 李衛紅,沈保全. 信息組織方法述略.情報雜志,2004,22(1):67-68.
[2] 鄧均華. 網絡分類搜索引擎與傳統分類法之比較分析――兼論建立我國信息組織分類標準. 河南圖書館學刊,2001,21(5):60-61.
[3] 周毅俊. 黃頁檢索語言探索. 中國索引,2005(2):30-32.
[4] 武利紅,李振紅. 分類法在搜索引擎中的運用思考. 圖書館學研究,2005(6):48-50.
[5] 劉蘇南.信息組織在中國電信信息服務中的應用. [2010-12-02].省略index.fudan.省略/lwj/2008/liusunan.ppt.
[6] 蘇瑞竹,吳英姿.利用分類法和主題法改善搜索引擎的性能. 情報科學,2001,19(11):1170-1175.
[7] 馬張華. 分類搜索引擎對分類法發展的貢獻及相關問題討論.中國索引,2005(3):14-18.
[8] 王衍,丁梅娟. 論企業信息資源的組織管理與開發利用. 科技進步與對策,2002(7):115-116.
[作者簡介]彤,女,1989年生,本科生。
關鍵詞農業信息分類;存在問題;網狀結構;原理;原則;優點
中圖分類號G201文獻標識碼A文章編號 1007-5739(2011)03-0047-03
AgricultureInformation′sClassificationBasedonReticulateFrame
YU Xin-kai 1LI Bin2MAO Min 1
(1 Guangzhou City Construction College,Guangzhou Guangdong 510925; 2 Guangzhou Agriculture Information Center)
AbstractBased on analysis of the system of agricultural information resources at present,a new measure so-called classification based on reticulate frame was brought forward,which helped to construct a scientific,efficient,lively system for the information resources.
Key wordsagricultural information classification;problems;reticulate frame;theory;principle;advantage
自1994年實施“金農工程”開始至今,農業類信息網站由最初的“中國農業信息網”(1996年建成)發展到目前已經超過3萬家,2009年前8個月就增加了逾8 000家,增長率達到38%,遠遠高于全國互聯網站平均增長速度[1]。
綜合對比全國各地的農業類信息網站,雖然我國各類農業信息系統在數量上和規模上一直處在持續增長勢頭,農業信息資源也不斷地充實擴大,但由于農業行業所涉及的相關領域十分廣闊,知識與信息內容繁多;加之我國在農業信息化建設方面尚未建立統一的數據標準,使得眾多農業類信息系統在信息采集、內容組織與展現、數據挖掘方面都各不一致,以致難以實現信息的高效共享,不利于信息資源的開發利用。
1農業信息資源的基本涵義
根據中國電子信息產業發展研究院的定義:農業信息化是指利用現代信息技術和信息系統為農業產供銷及相關的管理和服務提供有效的信息支持,并提高農業的綜合生產力和經營管理效率的相關產業的總稱。具體內容包括:農民生活消費信息化;農業生產管理信息化;農業科學技術信息化;農業經營管理信息化;農業市場流通信息化;農業資源環境信息化;農業管理決策信息化[2]。
根據《全國工農業產品(商品、物資)分類與代碼》(國家標準GB7635)的分類,農業作為第一產業,其包括農業產品、營林產品、人工飼養動物與捕獵的野生動物及其產品、漁業產品、觀賞植物和其他農、林、牧、漁業產品等六大類[3]。
據此,筆者認為對農業信息資源進行嚴格的、層次分明、界限明顯的分類是比較困難的,其不像教育、社會保障、醫療衛生、交通運輸、房地產等領域的信息資源那樣具有較高的內聚度和信息受用者的單一性、確定性和穩定性。通過對比很容易看出農業網站的信息內容“大而全”的特征面貌。
2對農業信息資源進行分類的必要性
“農業”是一個范疇非常廣泛的概念,凡是與農業相關的信息都可以作為農業信息――這幾乎是目前所有涉農網站信息內容所表現出來的“默認”看法或做法,是合乎邏輯、無可非議的。問題是,如果凡是信息皆為“信息”,那么讓信息受用者在這樣海量的信息世界里找答案就像是讓他們在圖書館里找法律條文一樣難。因此,有必要對農業信息資源的分類和呈現進行系統的技術分析,建立一個科學的、規范的、精簡的、高效的、實用的農業信息資源體系,使農業信息從最初的形成,到加工,再到最終的呈現,整個生存周期都能一直保持“所見即所得”的理想狀態。即讓信息受用者通過最簡便的方式,在最短的時間內獲取其認為有價值的信息。
3現階段農業信息的分類狀況
3.1常用的分類方法
按照傳統的分類方法,根據不同的維度[4]作為標志對農業信息資源進行分類,常用的分類方法有以下幾種:一是按信息所涉及的活動行為劃分,可分為農業行政管理、生產管理、經營管理、市場流通、農業科研等信息。二是按信息所涉及的商品對象劃分,可分為糧油、蔬菜、水果、水產、畜禽、花卉、農副產品、生產資料等信息。三是按信息內容的表現形式劃分,可分為文本、數字、圖表、圖片、聲音、演示稿、視頻、地理信息等多媒體信息。四是按信息表達內容所屬的文種劃分,可分為政策法規、政務公開、新聞報道、價格行情、科普知識等信息。五是按信息所體現的功能作用劃分,可分為政務辦理、信息查詢、在線論壇、問卷調查、上傳下載、電子商務等。六是按信息發生的時間劃分,可分為歷史信息、當前信息和預測信息。七是按信息的時效特征劃分,可分為實時信息、準實時信息和延時信息。八是按信息的空間范圍劃分,可分為世界、全國、各地方的農業信息。九是按信息內容變化的頻度劃分,可分為靜態信息和動態信息。以上各類分類方法在文獻表述上是可行的,根據研究對象側重點的不同而采用不同的維度進行分類。但是將包羅萬象的農業信息資源注入到一個相對不區分研究對象的農業信息系統中去,并同時保持各類信息之間清晰的界限和層次結構,這就不是一件容易的事。
3.2傳統分類方法存在的問題
一般都采用樹形結構對農業信息資源進行分類,這也是目前大多數農業網站所采用的一種方法。這樣的分類方法就其效果而言是比較直觀、易于理解,便于內容的組織與歸納(圖1),但其一方面忽略了各分支節點的內容交叉性;另一方面切割了各分支節點之間的內在客觀聯系。
一個典型的例子就是水果農產品的分類,按果類品種可分為蘋果、荔枝、龍眼、芒果等,一些農業網站相應地分別開設荔枝信息欄目、龍眼信息欄目等,但若同時也開設了“農科園地”欄目時,那么關于荔枝栽培技術的信息應該放在“荔枝專欄”還是“農科園地”呢?
對于分支節點的內容交叉性問題,有人曾提出笛卡爾積的解決辦法,即N1×N2×……×Nm×……×Nn,其中n是維度數,表示有n種分類方法,按每一種分類方法可將農業信息分為Nm類,以此來達到完整地覆蓋所有分支節點的目的(圖2)。
舉個例子,比如某農業網站有3個信息欄目:一是栽培技術欄目下開設了荔枝、龍眼、芒果等子欄目;二是荔枝欄目下開設了栽培技術、市場信息、名優品種等子欄目;三是市場信息欄目下開設了畜禽、水果、花卉子欄目,水果子欄目下又開設了荔枝、龍眼、芒果等子欄目。按照這種設計方法,欄目的數量和其結構的復雜度將按級數遞增,無論是內容的管理策劃者還是信息瀏覽者都很容易陷入迷宮陣,既不方便內容的管理又不利于信息的傳遞,同時又造成了大量冗余的信息重復出現。
本文為全文原貌 未安裝PDF瀏覽器用戶請先下載安裝 原版全文
對于按樹形結構分類法,則會隱藏掉事物間的內在客觀聯系規律。例如將關于荔枝、龍眼的產量、上市信息分別放置在荔枝專欄和龍眼專欄中,則會讓人難以發現這2種水果在產量和銷量方面的聯系。實際上,在珠三角地區能種植荔枝的地方一般也可以種植龍眼,而且是在同一季節收摘和上市的,同時面向總銷量比較穩定的消費市場。因此它們之間的產量和銷量肯定會存在一定的客觀聯系,而這些規律正是數據挖掘者所關心的,因為這些相關數據正是創造信息價值所依賴的基礎,是實現信息資源二次開發利用的關鍵因素。
4網狀結構分類法的實現
4.1網狀結構分類法的原則
在構建網狀結構的農業信息分類體系時,應當把握好以下原則:一是科學性原則[5]。所選擇的維度標志必須能反映事物的本質特征并具有明顯的區別功能和穩定性,以滿足分類的客觀要求。二是系統性原則。每一個分類維度標志的內涵都必須是互相獨立、無重復的,所有維度標志的總和所涵蓋的內容能夠構成完整的農業信息范疇和領域。三是規范性原則。分類首先應該符合相關的國家標準、行業標準和其他規范性文件。四是實用性原則。應充分滿足生產、流通及消費的需要,同時要有利于數據挖掘和知識發現。五是擴展性原則。要事先預見并設置或預留足夠的類目,以保證在新事物出現時不至于打亂已建立的分類體系和結構。六是兼容性原則。即同一個信息單元出現在不同的類目時,既不會帶來信息冗余,也不會產生內容上的歧義。
4.2網狀結構分類法的設計原理
在數據倉庫理論中有一種數據組織模型叫做數據立方體,是n維笛卡爾積空間的表現為三維的形式。網狀數據結構則是結合上述的樹形數據結構和n維笛卡爾積空間結構經過改進演化而來的(圖3)。
4.3構建步驟
一是將農業信息資源按照樹形結構分類,如圖1所示;二是調整每一個維度及其分類的位置并旋轉一定的角度,形成一個有邊界的多邊形整體效果,將所有的農業信息單元數據對象放在這個全集空間中考察;三是對于實踐中所生產的每一個信息單元,先根據信息的主要功能與價值確定其直接歸屬的欄目,用實線連接該信息單元和其宿主欄目;四是考察信息單元與其他欄目的關聯性,關聯性強的用虛線連接,關聯性弱的則不連接;五是當所有的維度分類和信息單元都在這個全集空間中標示出來時,再把該模型放到立體空間去觀察,最后得到一個球形網狀的結構模型[6]。
5基于網狀結構的農業信息分類技術的優點
一是有效地考慮到了不同維度的交叉部分,實現了各類農業信息的相互兼容性,消除了信息損耗。二是有利于揭示不同信息單元之間的內在客觀聯系,為進一步的數據挖掘和信息資源開發利用提供很好的原始數據。三是消除了笛卡爾積分類結構帶來的大量多余的、空的、無意義的冗余信息,使整體結構更加清晰,同時也為物理設備節省了大量的存儲空間。四是所有信息單元與其宿主欄目和關聯欄目都用連線連接,使得整個分類系統更加富有組織性、有機性,為信息的查詢、檢索、匯總統計提供了豐富的線索。五是使得信息采集、編輯工作更加高效,例如對于一則標題為“荔枝農莊新景象,現摘現買又觀光”的信息,同時兼有新聞、市場行情、休閑觀光等性質,既可以放在水果欄目又可以放在新聞欄目,按傳統的分類方法,經常會給網站信息工作者帶來煩惱和隨意性。而按網狀結構分類方法,將荔枝專欄作為該則信息的宿主欄目,同時為其附加上新聞、市場、觀光、圖片等維度的屬性標記,再通過一定的信息呈現技術手段,使得信息瀏覽者在相關欄目下也能獲取該則信息。
6結語
農業信息化建設在全國范圍內取得如此迅速的發展,在很大的程度上得益于國家同時對農業基礎設施和IT產業的大力投入[7-8]。從基礎設施的建設規模來看,確實取得了長足的發展,許多邊遠山區都得到了信息服務的延伸和覆蓋。但基于目前大多數農業信息系統的發展現狀,我國的農業信息服務水平在功能與效用方面還處在粗放型的階段。基于網狀結構的信息分類技術為如何進行農業信息資源的深度數據挖掘和開發利用提出了解決思路,在分類技術上提出了更加適合于我國農業信息資源體系建設的解決方案。
7參考文獻
[1] 王法英,孫銳.中國農業網站基本情況分析報告[EB/OL].(2009-10-16)[2010-11-03]..
[2] 搭建信息化平臺推進新農村建設[EB/OL].(2010-03-18)[2010-06-20].省略/art/184371201003/8/2015483-1.html.
[3] 國務院.GB7635.全國工農業產品(商品、物資)分類與代碼(國家標準GB7635-87)[S].北京:中國標準出版社,1987.
[4] 王健,甘國輝.多維農業信息分類體系[J].農業工程學報,2004,20(4):152-155.
[5] 嚴方.試論互聯網農業信息分類的原則和方法[J].安徽農業科學,2007.
[6] 羅德一.農業網絡信息分類體系初探[J].農業圖書情報學刊,2010(8):84-87.
[7] 牛振國,崔偉宏,符海芳.多維網絡農業信息分類框架的初步研究[J].農業系統科學與綜合研究,2003,19(4):274-277.
[8] 郭書普.網絡農業信息分類和編碼的研究[J].農業圖書情報學刊,2003(6):139-141.
【關鍵詞】集控站;信息;優化
1.前言
隨著集控站在全省范圍內的逐步推廣和使用,遠動自動化信息優化意義重大。從集控站和電網調度關系的層面來說,變電站事故主要由集控站監控人員進行決策、判斷和處理,電網調度負責整個電網運行方式執行及事故決策和處理。
2.集控站遠動自動化信息分層分類范圍和目標
本文以沱河集控站為例,進行集控站自動化系統信息優化,實現遠動自動化信息分層分類。
遠動自動化信息性質層面上的分層分類。根據電網信息的重要性,集控站自動化系統需將電網事故、異常信息按不同類別在告警窗口上分類顯示;編制遠動自動化信息分類規范,為今后變電站自動化信息接入范圍提供標準。
集控站用戶界面層面上的信息分類。編制典型的用戶交互界面,為集控站監控人員進變電站的設備巡視和事故處理,提供方便、快捷的手段。事故處理時,能依據事故來源進行迅速溯源。通過事故告警,定位變電站一、二次系統,通過一二次設備的關聯信息,使運行值班人員迅速定位事故發生地點。
3.遠動自動化信息分層分類的主要做法
3.1變電站自動化信息分類
將變電站運行信息分為四種基本類型:事故信號、第一類告警、第二類告警及第三類告警。
事故信號:事故信號事故總,保護、自動裝置動作,斷路器跳閘信號
第一類告警:設備故障告警,異常運行或過負荷等信號;第二類告警:系統波動干擾,參數越線等信號;第三類告警:正常運行信號,操作信息、主變調節分接頭,特殊控制等。
將變電站一、二次設備狀態、動作信號進行分類,在變電站新建、改造時,該分類作為該變電站遠動基本的和必需接入的信息。
事故類:變壓器各種電氣量保護動作、保護出口信息;變壓器各種非電氣量保護動作及保護出口信息;變壓器開關變位信息;開關各種保護動作、保護出口信息、開關變位信息;壓變二次空氣開關跳、壓變二次回路斷線;所用變低壓總開關跳及故障;直流系統接地及交流輸入輸出故障
第一類告警:變壓器過負荷、油位高低、壓力釋放動作、保護裝置告警、閉鎖調壓、超溫、冷卻裝置故障類的信息、冷卻裝置電源故障;開關控制回路斷線、彈簧未儲能、氣體壓力低類、氣壓低閉鎖操作類、液 壓機構壓力低、保護裝置異常告警、液壓機構壓力低、保護裝置異常告警、保護閉鎖、機構箱內的各種異常告警信息;電壓回路斷線、電流回路斷線、互感器氣壓低、互感器需補氣等信息、計量用電壓 消失、保護用電壓消失;交直流回路缺相等、交流系統設備運行故障告警
第二類告警:各級母線電壓越線
第三類告警:遙控操作信息、正常操作開關變位信息、主變分接頭調節信息、刀閘變位信息、壓變二次并列信息、保護裝置及遠動裝置上的操作信息、遠動及監控系統運行信息、開關把手遠方就地信息、變壓器冷卻裝置運行
3.2集控站用戶界面層面上的信息分類
在集控站自動化系統上,通過信號關聯和畫面制作,完成典型用戶交互界面的編制。
變電站正常運行時,顯示綠色,發生事故或告警時,該變電站時顯示為紅色。分類依據:以每個變電站分別定義為獨立的信息對象個體,當該站任何動作事件而沒有復歸確認時,光子牌信號顯示紅色。點擊某個變電站則進入該站的平面布置圖。
某變電站發生事故或告警時,顯示該變電站平面圖內。變電站平面圖內容包括:主控制室、110kV設備區、35kV設備區、1#主變設備區、2#主變設備區、10kV開關室等,每個設備區內均顯示各間隔的運行狀態,異常時,該設備區某間隔光子牌顯示為紅色。點擊某個設備區,則以彈出式窗體,列出該設備區內各間隔所有信號狀態。其中,為了事故處理時能及時掌握現場情況,加入了“微機保護動作查詢”功能。需要一提的是,所有二次設備信號均歸類到相應的一次設備間隔內,目的是減少監控人員操作畫面的次數,以提高事故處理的效率。
3.2.1開關類
進入該區域后,系統將按照一次開關等設備間隔,顯示該開關及其機構的狀態信息。
信息分類規則:按設備間隔(110kV變電站開關類間隔信息內容)
開關機構異常類:開關彈簧未儲能、氣體壓力低類、氣壓低閉鎖操作類、液壓機構壓力低、保護閉鎖、機構箱內的各種異常告警信息、開關狀態信息
保護動作類:開關控制回路斷線、兩側刀閘狀態、保護裝置異常告警、保護閉鎖、保護電壓消失、各種保護動作及出口信息、保護裝置的操作信息、遠控/就地把手狀態
互感器類:電壓互感器的低壓空氣開關跳、互感器氣壓低、互感器需補氣等信息、計量用電壓消失兩側刀閘狀態、壓變二次并列、PT失壓、二次回路斷線等狀態信息
3.2.2主變設備區,按照變壓器本體及保護兩類按照變壓器間隔合并歸類變壓器本體動作類:油位高低、壓力釋放動作、閉鎖調壓、超溫、冷卻裝置故障類的信息、冷卻裝置電源故障、有載調壓裝置故障類的信息、有載調壓裝置電源故障、中性點刀閘位置等變壓器保護動作類:過負荷、各種電氣量保護動作及保護出口信息、各種非電氣量保護動作及保護出口信息、變位信息
3.2.3交、直流設備類型
交流系統:所用電電源故障、所用電空氣開關跳等信號
直流系統:電壓過高、電壓過低、母線接地、充電機故障、直流系統交流失電等狀態以及異常信息
4.推廣應用
通過集控站遠動自動化信息優化,提高電網監控效、減少電網故障處理時間,有利于保障電網安全可靠運行。在集控站自動化系統上,通過信號關聯和畫面制作,完成受控站典型用戶交互界面的編制。
某變電站發生事故或告警時,顯示該變電站平面圖內。變電站平面圖內容包括:主控制室、設備區、主變設備區、開關室等,每個設備區內均顯示各間隔的運行狀態,異常時,該設備區某間隔光子牌顯示為紅色。信息分類依據:以每個設備區內設備間隔定義為獨立的信息對象個體,當該設備間隔內任何動作事件而沒有復歸確認時,光字牌信號顯示紅色,點擊某個設備區,則以彈出式窗體,列出該設備區內各間隔所有信號狀態。其中,為了事故處理時能及時掌握現場情況,加入了“微機保護動作查詢”功能。需要一提的是,所有二次設備信號均歸類到相應的一次設備間隔內,目的是減少監控人員操作畫面的次數,以提高事故處理的效率。
由于二次保護部分已歸類到相應的一次設備間隔中去,主制室設備區主要包含交流系統、以及直流系統等類型。分類依據:按交、直流設備類型。
【關鍵詞】網頁;分類;www;林產品;TF-IDF;SVM
1.引言
根據中國互聯網信息中心(CNNIC)的最新數據顯示,截止到2013年12月底,中國網民數量達到6.18億,國內網站達到320萬個,伴隨著互聯網的迅速普及,我國的林產品貿易信息類網站也日益成熟,林產品貿易信息的數量急劇增加,用戶面對海量的數據信息很容易產生信息迷航,針對這些問題林產品貿易信息聚合網站應運而生。此類網站通過爬蟲程序將分散在互聯網上各個站點上的林產品貿易信息進行匯總,但是不同林產品貿易網站之間的分類體系差別巨大[5],如何將匯總的信息按照統一的分類體系進行劃分,以便為用戶提供快速的導航式查詢成為林產品貿易信息服務中的重要一環。本文選取了SVM作為分類器。SVM是Vapnik等人在多年研究統計學習理論基礎上對線性分類器提出的一種機器學習方法。SVM的主要思想可以概括為兩點:(1)它是針對線性可分情況進行分析,對于線性不可分的情況,通過使用非線性映射算法將低維輸入空間線性不可分的樣本轉化為高維特征空間使其線性可分,從而使得高維特征空間采用線性算法對樣本的非線性特征進行線性分析成為可能;(2)它基于結構風險最小化理論之上在特征空間中建構最優分割超平面,使得學習器得到全局最優化,并且在整個樣本空間的期望風險以某個概率滿足一定上界。
2.林產品貿易信息分類系統設計
2.1 林產品貿易信息分類系統流程
林產品貿易信息分類過程包含樣本訓練和分類兩個階段,兩個階段的共同之處是都需要對HTML頁面進行預處理并對處理后的文本進行分詞。訓練時通過特征選擇,生成特征向量,最后得到分類模型;分類時先生成特征向量,利用分類模型進行分類,最后得到分類結果[1]。
2.2 HTML解析
HTML文檔中包含大量與林產品貿易信息無關的文本,因此在進行分類之前先要去掉與網頁分類無關的html代碼,將網頁文本抽出。HTML文檔中等標簽中用來描述網頁的表現形式,與網頁的具體內容無關,因此可以直接去除。另外,在林產品貿易信息頁面中,噪音信息多為導航和廣告連接,通過去除HTML文檔中的鏈接文字可以有效的去除網頁中的噪音信息。
圖1 分類流程設計
2.3 訓練樣本分詞
分詞的目的是將文檔分割成一個個的單詞。一般可以將所有樣本的詞都提取出來作為特征集,默認情況下,所有詞的權重都是等同的。分詞完成之后就要去除"停用詞"了。所謂的"停用詞"是那些沒有意義的詞語,他們對文本分類沒有貢獻,比如說各種標點符號,今后、今天、今年這樣的詞語等。去掉這些沒有作用的詞語可以減少文本特征集的元素數,從而減少不必要的運算量。本文中使用的分詞工具為ICTCLAS。
2.4 生成特征向量
生成特征向量前首先要進行特征選擇。特征選擇是就是依據某種權重計算公式從詞典中選擇一些有代表性的詞。常用的特征選擇的方法有很多種,例如:Chi、Mutual Inform-ation、Information Gain和TF-IDF[2]。
本文利用TF-IDF方法進行特征選擇。TF-IDF是一種統計方法,用以評估一個字或一個詞對于一個文件集或一個語料庫中的其中一份文件的重要程度。字詞的重要性隨著它在文件中出現的次數成正比增加,但同時會隨著它在語料庫中出現的頻率成反比下降。特征項在文檔中的權重可以根據公式(1)進行計算[4]。
(1)
其中tfi(d)為ti在文檔d中出現的頻率,N為文檔集中的總文檔數,nk為出現特征向量tk的次數。
2.5 生成分類模型
將文本轉換為向量后,后面要做的工作就是利用SVM算法進行樣本訓練了。SVM算法本質是二類分類器,為解決多分類問題目前常采用的方法是one-against-rest[3]。本文使用Libsvm構建SVM分類器。Libsvm是一個簡單、易于使用和快速有效的SVM分類工具。使用時直接輸入訓練樣本,并配置相應參數,即可進行模型及預測。
3.實驗及結果分析
本文從采集了10個類別共5000個網頁,每個類別隨機抽取3/5作為訓練樣本,余下的2/5作為測試集,如表1所示。
表1 實驗數據
類別 訓練集網頁數 測試集網頁數 網頁總數 類別 訓練集網頁數 測試集網頁數 網頁總數
樺木 300 200 500 膠合板 300 200 500
松木 300 200 500 防火板 300 200 500
紅木 300 200 500 纖維板 300 200 500
楊木 300 200 500 密度板 300 200 500
榆木 300 200 500 刨花板 300 200 500
本文中用于評估的兩個指標分別是準確率(Precision)和召回率(Recall)。其數學定義如下:
準確率:;
召回率:,
其中,Np是分類器預測為C類的文檔數,Nc是實際屬于C類的文檔數,Ncp是正確分類的文檔數。
圖2 實驗結果分析
由圖2可見P,R以及F值均較高,說明該方法在應用在林產品貿易Web信息分類時較為有效。
參考文獻
[1]段軍峰,黃維通,陸玉昌.中文網頁分類研究與系統實現[J].計算機科學,2007,34(6):210-213.
[2]孫建濤,沈抖,陸玉昌,等.網頁分類技術[J].清華大學學報:自然科學版,2004,44(1):65-68.
[3]許世明,武波,馬翠,等.一種基于預分類的高效SVM中文網頁分類器[J].計算機工程與應用,2010(1):125-128.
[4]王美方,劉培玉,朱振方.基于TFIDF的特征選擇方法[J].計算機工程與設計,2008,28(23):5795-5796.
[5]陳劍.林產品貿易信息推送的文本信息過濾技術的研究[D].北京林業大學,2012.
基金項目:中央高校基本科研業務費專項基金資助項目“多元異構林產品信息推送平臺研究與實踐”(項目編號:BLYX200928)。
【關鍵詞】信息;審核;分析;加工;存儲共享
信息采集是信息內容和信息應用業務發展的基礎,通過采集大量真實、有效的客戶信息、供求信息、交易信息等,可以有效促進網絡商務的發展,成功的網絡商務交易,同樣可以增強客戶對信息的渴求,對網絡的黏性,提升了信息采集的針對性、目的性,使采集的信息更準確、更具市場價值。因此,實施信息采集、發展網絡商務,開辟并建立起直接面向客戶與市場需求的信息采集渠道,建立健全信息采集、分類、審核、加工、的信息內容服務保障體系和網絡商務運營體系,是企業價值極大提升的關鍵工作。
一、信息采集的組織架構
以客戶為中心,利用渠道優勢、客戶資源優勢,從省、市、縣三級設立專職人員從事省級信源的規劃、采集、審核、錄入、加工、分析、、共享等工作。
二、信息采集的渠道
可通過客戶經理、營業廳、農村信息服務站、社區、呼叫中心坐席、互聯網、合作渠道、經紀人采集信息。
1.采集對象
所有產業活動的單位、個體經營戶、鄉鎮企業,都是信息采集的目標客戶,包括所有的在網客戶與異網客戶、所有的企業客戶與農村客戶。從需求上分為客戶需求和市場需求兩種:
客戶需求為:客戶主動各類信息(以供求信息為主)達到宣傳自身或其產品的目的。采集對象的確定以客戶意愿為準,只要客戶的資質及其產品符合要求和規定,即可確定為采集對象。
市場需求為:客戶對此信息有查詢、搜索需求。采集對象的確定遵循以市場為導向,以客戶為關注焦點的原則,即:通過分析公眾客戶對信息的需求程度和客戶數量,達到公眾客戶總量的0.5%-1%,即可確定為采集對象。如公交信息、票務信息、天氣預報、市場行情等。
2.采集內容
基本信息:企業名稱、通信地址、聯系人、聯系電話、郵編等客戶基礎信息。
資質信息:各類專業資質、工商執照、稅務登記證明等能夠證明客戶合法、合規和具備相關行業的資質證明等信息資料。
供求信息:企業供應或需求的各類產品及服務信息,如產品信息、企業LOGO、多媒體播放信息等。
3.信息分類標準
可依據國家統計局行業劃分標準《國民經濟行業分類》和相關編碼規范,參考業界行業分類現狀,結合通信行業特點,對比各業務平臺分類情況,將行業分類標準統一。
4.信息采集標準
必須遵循及時性、準確性、有效性、系統性、適用性、完整性等標準。
5.信息標準要求
客戶信息存放到數據庫中,除企業名稱、通信地址、聯系人、聯系電話、郵編等基本信息外,還包各類專業資質、工商執照、稅務登記證明、產品信息、提供服務等資質信息、供求信息,除此之外都要有城市編碼、分類代碼,表明客戶所在城市和行業分類。
三、信息內容的審核
設置初審和終審兩級審核機制,審核信息內容的準確性、安全性、有效性、時效性、完整性,保證信息內容的合法性。
(一)審核規范
1.根據相關法律、法規,退回禁止銷售和涉及侵權及假冒的信息;
2.審核所填資料的真實性,如有必要,需提供證明文件,如出現其他公司名稱等情況;
3.審核信息和圖片的相關性,不允許圖文不符的信息;
4.審核信息是否為信息采集對象的內容;
5.審核信息是否在采集內容和信息分類范圍內,不符合標準的信息應不在信息采集庫中;
6.審核的信息分類是否正確;
7.判斷產品是否含欺詐、偽造成份;
8.審核信息是否符合采集標準及要求。
(二)審核步驟
1.初步審核。由信息采集人員或各采集點專(兼)職審核人員對采集信息內容的權威性、真實性、準確性、時效性、安全性和信息在前臺頁面展現形式的合理性進行初步的審核。
2.最終審核。由專職信息審核員對錄入的信息內容進行甄別、篩選、加工等,確保信息的權威性、真實性、準確性、時效性、安全性并提交(參照審核規范)。
3.對用戶修改的信息進行初審和終審,遵循上述兩個步驟。
(三)審核時限
信息初審要求0.5個工作日審核完畢,并在2小時內完成信息的錄入。
信息的終審、環節要求及時審核上傳的信息,信息處理時限為0.5個工作日內完成信息的終審與。
對于客戶在網站上自主注冊錄入的信息,要求當日內處理且1小時內完成審核及信息。
由管理人員對通過審核的信息進行部分抽查,做到信息審核的精準性,同時也對相關人員進行監督檢查。
四、信息內容的分析加工
對收集的信息進行梳理、研究并深度加工的過程,包括對信息整理研究結果的表達以及價值評價等,是信息廣泛應用的基礎和前提。
按內容分析,分析采集項的優先級、必要性、精準性;分類是否精準、信息是否可以兼容分類等;對采集對象、內容等的擴展研究分析,分析是否加上某些信息項、是否修改或去掉某些信息項。
按區域分析信息數量,區域內某一行業的信息數量。
按行業分析某一行業不同區域的信息數量。
按某信息項分析,如根據客戶信息內容分析基本信息、供求信息等。
五、信息內容的存儲、共享
信息的存儲:分類、審核的信息加工、處理,歸集到數據庫中,便于各個業務平臺的信息調用及應用。
信息的傳遞、:準確地客戶信息,同時對重點關鍵的信息進行深挖掘和深加工,提取具有市場價值的信息,通過共享、互通的方式傳遞給其他系統、渠道和崗位,針對客戶的需求開展信息的銷售。
六、信息內容的應用
1.信息應用
通過對采集的數據進行集中和整合,統一標準和定義,形成數據信息資源庫,做好信息安全、保密工作,同時共享給各平臺提取所需數據。如:為黃頁業務發展提供客戶的基本信息,網絡商務應用等。
2.信息評估
一、XBRL簡介
可擴展商業報告語言,簡稱XBRL(ExtensibleBusinessReportingLanguage),是一種編制、公司財務報告和其他信息的標準化方法。實際上XBRL是一種平臺式的數據描述語言,他通過一種編譯來達到財務信息交流的目的,其實質是會計信息的一種讀取方式。XBRL被廣泛應用于財務報告、審計報告等方面,是現代財務信息管理的重要方法。
二、XBRL在會計信息標準化中的應用
XBRL是會計信息標準化的重要推動力和催化劑。由于XBRL的介入,會計信息標準化的步伐進一步加快,財務信息處理的速度和效率、質量都得到迅速的提高。
1、XBRL推動了內部控制標準化。會計信息標準化中的內部控制標準化指的是組織通過制定財務相關的規章制度以及防控方法及流程,防止和減少會計遺漏、營私舞弊等帶來的財務失真,保證財務信息的真實性和資產的安全、準確。XBRL利用自身的標準化優勢驅使組織按照其標準模式進行操作,使財務會計信息控制更加透明化,增加可控制性,減少因人為或主觀因素導致的財務信息失真,進而控制財務信息的內部標準化。會計信息標準化的首要設計目標就是內部控制的標準化,其意義在于只有內部形成統一的控制標準才能真正實現財務信息的可對比性和對查閱性。XBRL利用標準化的控制體系要求組織按照其標準執行財務信息的標準統一控制,這在一定程度上來說使得組織內部控制標準化得以實現。組織實施XBRL在無形中推動了會計信息標準化的進程。
2、XBRL推動了會計流程和財務信息處理標準化。XBRL是一個完整的體系,它按照標準的流程來處理問題和實現財務信息的交換。而在會計信息標準化過程中,核心實現的是會計流程和財務信息處理的標準化。隨著組織的不斷擴大和會計信息標準化的不斷加深,會計流程和財務信息處理的標準化逐步被提到議事日程上來,如何利用信息化手段實現會計流程和財務信息處理的標準化,有效防范會計風險成為一個重要的課題。XBRL在實施過程中利用自身標準化的優勢,為會計流程和財務信息處理的標準化提供了便利。
首先,會計流程標準化和財務信息處理標準化需要完整的標準化數據交換作為支撐,XBRL作為一種基于信息化條件下實現的數據交換及解析工具,具備了提供這種支撐的條件。會計流程標準化其實是會計流程再造的一種形式,其本質在于在現代經濟環境下實現會計流程的合理化和嚴謹化,規避會計流程風險;財務信息處理的標準化是在原有的帳務處理以及財務數據及信息交換基礎上,轉變非結構化財務信息的處理方式,逐步實現財務信息處理的規范化和標準化。XBRL利用自身規則要求會計流程和財務信息處理必須按照固定標準執行,這就在根本上約束了會計流程和財務信息處理的隨意性。
其次,財務信息處理日益紛繁復雜,傳統的信息處理方式已經無法滿足各部門對于財務信息的需求。傳統的財務信息處理難以實現共享,其他部門要使用還需要專門人員進行翻譯。這就消耗了大量的人力和物力,并且在翻譯的過程中由于種種原因不免產生誤差和錯誤,這就造成了財務信息的失真。另外,財務信息在處理過程中,由于審批、傳遞環節往往需要經過不同的部門,各部門難以了解財務信息的真實意義,導致審批失效,達不到預期效果。因此,XBRL在財務信息處理過程中的應用也就顯現的更加必要。將XBRL應用于財務信息處理可以規范化各類財務報表和財務信息,使各部門實現共享,有效避免在審批和傳遞環節出現的失真和脫節現場,實現財務信息的可重復利用性。
第三,非結構性財務信息的處理日益成為會計信息標準化的一大障礙,消除這一障礙將有效促進財務信息處理的標準化。合理利用XBRL,建立一整套的財務信息處理標準,利用標準化的處理方式來解決非結構性財務信息處理問題,將有利于非結構化財務信息處理的結構化處理,從而掃除財務信息處理標準化進程上的一大障礙,保障其順利推進。
第四.財務信息處理注重提高財務信息,尤其是會計信息的質量,而這一質量的提高需要依靠信息化的現代信息技術。傳統會計信息質量往往通過投入大量人員進行反復核算來實現,不僅浪費大量人力,還有可能造成會計信息的失真。XBRL作為信息交流的平臺類語言,其可以使用統一的標準來約束會計行為,從根本上杜絕會計信息質量的失真。
3、XBRL促進財務信息分類匯總的標準化。財務信息紛繁復雜,尤其是在現代商業模式和經濟運行水平下,財務信息的收集、整理和分析顯得更加重要。財務信息的分類匯總使得財務信息應用更加方便,傳統的匯總手段多采用紙質的檔案形式,在現代信息條件下,網絡和數據化存儲成為主流,新的財務信息分類匯總方式要求新的標準化流程來操作。XBRL在操作過程中要求財務信息分類匯總標準化的出現,這在一定程度上促進了其標準化的過程。
關鍵詞:知識管理 知識化監理 知識結構
信息工程監理是最近幾年興起的保障信息化建設質量的一種約束機制。它采用“五控兩管一協調”的控制模式,對業主、承建單位的項目行為實施監督,保障信息化建設的質量,避免“豆腐渣”工程,起著不可或缺的重要作用。
一、信息化建設與知識管理
信息化建設是以知識管理為核心,信息資源為基礎,提高組織核心競爭力為目的的全面整合或再造組織業務流程的過程。知識管理是獲取、儲存、學習、共享、創新知識的管理控制過程。在信息化建設中,企業、政府等組織通過知識管理,從現有的業務流程和數據中,挖掘、獲取并確定各類知識資源,定位擁有專業知識、經驗的個體,將個體的知識、經驗、信息提升為組織的知識資源,有序傳遞、整合、規劃和有效利用知識資源,有助于提高組織的整體業務、技術和管理水平。
在承建單位實施信息化建設中,知識管理是通過公司內雇員、部門、可能的跨國公司合作、與業主的溝通協調,傳遞、整合、有效利用本單位的知識資源,運用信息技術,通過設計最優技術方案、控制施工質量,共享和創造知識價值。
在信息化建設中,對組織內各種各類知識進行評估,挖掘、獲取真正有用的知識。知識不僅僅是信息,是顯性知識和隱性知識的集合。通過評估,區分知識和信息、知識管理和信息管理,以實現資源的充分開發與應用。
整合或再造業務流程,是與知識管理密切相關的。1990年美國管理專家Michael Hammer提出了“業務流程重組”(Business Process ReengineeringBPR)的概念,它是以用戶需求為導向,信息化、知識化為基礎,對用戶的業務流程進行再思考、關鍵性的重新設計和根本的變革,從而獲得在成本、質量、服務和速度等方面業績的持續改善。在業務流程重組中,信息(知識)的獲取、分類、存儲、利用,只有與知識管理結合,才能夠發揮更有效的作用。
知識管理技術貫穿于信息化建設始終,它與信息技術相輔相成。在知識獲取、學習、共享、創新的過程中,整合各種信息技術,構建完整的知識管理體系,是知識經濟時代信息技術的新發展。
二、信息資源規劃和整合
信息資源整合(Information Resource Integrating, IRI)的前提是進行統一的信息資源規劃(Information Resource Planning, IRP),消除“信息孤島”,共享信息資源。信息資源的規劃是實施信息化工程的基礎,IRP的基礎是建立信息資源管理基礎標準,IRI的實質是通過信息技術改造、重建或重構數據環境。信息產業部的《信息系統工程監理暫行規定》中定義信息資源系統為“以信息技術為主要手段建立的信息資源采集、儲存、處理的資源系統”。
在信息化建設中,信息資源規劃是很重要的一環。在組織的生產、經營、服務活動中,會產生大量的數據、資料、指標、圖紙、報表及其它顯性資源,也存在各種各類的知識、擁有專業知識和經驗的個體等隱性資源。信息資源規劃是對實施信息化后產生、控制、使用這些資源進行識別和分類;評估、挖掘、獲取、共享各類知識;對承載信息資源的信息基礎設施進行分析、設計和指導。
(一)信息資源規劃的主要任務
信息資源規劃的任務是對支撐業務流程的邏輯相關的數據進行分類,建立具有結構化、標準化、一致性的共享數據庫。分析業務流程重組后產生、控制和使用的數據,了解各種數據的內容、范圍、可靠性等,理解數據的共享要求和應用策略以及數據使用中的問題,使信息資源規劃能夠滿足數據資源的管理要求。
(二)信息資源管理標準
信息資源管理標準是指決定信息系統質量的、進行信息資源開發利用的基本標準。威廉·德雷爾1985年在其《數據管理》專著中總結了信息資源管理的基礎標準———數據管理五項標準,內容如下:
1.數據元素標準。數據元素(Data Elements)是信息資源中最小的信息單位,是抽象的數據對象。它的質量是構建穩定的數據結構基礎的關鍵。數據元素標準包括數據元素命名標準、標數據元素識標準和數據元素一致性標準。
2.信息分類編碼標準。是信息標準中的基礎標準。信息分類編碼(Information Classifying and Coding)的對象,是一些最重要的數據元素,自動處理、檢索、存儲和傳輸信息的質量及效率與這些元素緊密相關。信息分類是根據信息內容的屬性或特征,將信息按一定的原則和方法進行區分和歸類,并建立一定的分類系統和排列順序,便于管理和使用信息。信息編碼就是在信息分類的基礎上,將編碼對象賦予有一定規律性的、易于計算機和人識別和處理的符號。信息分類編碼工作要確定每個編碼對象的編碼規則、碼表結構和代碼表。
3.用戶視圖標準。用戶視圖(User View)是一些數據元素的集合,表示用戶對信息需求和數據實體的最終解釋。用戶視圖是數據的系統外在表現形式,是系統的輸入、輸出媒介和手段。用戶視圖與外部數據流是同一詞,來自某個數據源或流向某個數據接收端的數據流。常用的用戶視圖有紙面的,如圖紙、單證、表單、報表、賬冊等;有電子的,如屏幕格式等。
4.概念數據庫標準。概念數據庫(Conceptual Database)是用戶對數據存儲的最終解釋。用戶的信息需求,應首先界定概念數據庫。概念數據庫是綜合信息資源用戶的數據要求構成的全局數據庫,表示數據庫的整體數據組織狀況和邏輯結構。
5.邏輯數據庫標準。邏輯數據庫(Logical Database)是系統分析設計人員的解釋。在關系數據庫模型中,邏輯數據庫是一組規范化的基本表(Base Table),是從概念數據庫中映射出的所需信息。邏輯數據庫表示的是局部數據的數據庫邏輯結構。
(三)信息資源規劃方案
在定義數據管理標準的基礎上,制定信息資源規劃方案,為業務流程重組提供依據,為系統設計提供基礎。
在信息資源規劃中,將隱性資源轉變為顯性資源,有序傳遞、整合、規劃和有效利用各類知識資源。因此,信息資源規劃是資源的知識管理規劃。信息技術的投資,可能不會給企業帶來明顯的效益,因為基于信息的競爭優勢正在逐漸轉變為基于知識管理的競爭優勢,以信息資源規劃為核心的信息系統規劃,如果不實施知識管理,將不會產生顯著的信息化效益。
(四)資源整合
資源整合是信息資源規劃的關鍵。不僅僅信息整合,也包括各類顯性、隱性知識的整合。如何在整合各類知識資源中創新,是信息資源規劃的主要目的。在資源規劃中,既要考慮信息化建設前期的知識挖掘、分類、整合;也要考慮信息化實施過程中形成的各類資源的收集、分類、整合,如何有序傳遞、有效利用;
還應考慮后信息化應用過程中將要形成的分散的、孤立的、相互關聯的各類資源的整合。通過資源整合,實現資源最大可能的高度共享和有效利用,使內容和服務提升到新的高度,消滅大量存在的“信息孤島”或“信息煙囪”,獲得信息價值的最大化;使信息技術的投資獲得增量,將潛在價值轉變為企業發展的動力。
三、基于知識管理的信息工程監理
在信息化建設中,采用全面質量管理的思想。實施全面質量管理,是信息工程監理的控制目標。美國質量管理專家費根鮑姆(A. V. Fergenbaum)于20世紀60年代提出的全面質量管理思想,是隨著科學技術的發展和經營管理的需要逐步發展起來的現代化質量管理學科。其深刻內涵已經遠遠超出一般意義的質量管理領域,而成為一種綜合的、全面的經營管理方式和理念。
如何在信息化建設中實行全面質量管理,以保障信息系統工程的質量,是需要在實踐中探索和研究的。信息化建設監理機制是保障信息系統工程質量的重要手段,“三控、二管、一協調”及知識產權保護和安全控制是監理的核心,也是在監理過程中實行全面質量管理的核心。
(一)全面質量管理的定義
全面質量管理在ISO 9000族標準中的定義為:“一個組織以質量為中心,以全員參與為基礎,目的在于通過讓顧客滿意和本組織所有成員及社會受益而達到長期成功的管理途徑”。在知識經濟時代,這種管理應向知識管理延伸和發展。建立知識管理體系,是提高企業競爭力、推動企業發展的動力。實施全面質量管理就是建立質量控制的知識管理體系。
知識管理貫穿信息化建設的始終,在全面質量管理過程中得到體現。通過知識管理,幫助企業從已存在的信息中挖掘、分析、整合有用的知識,發現和創造新的知識,提升質量管理的質量。信息化的特征是技術和服務,在知識管理中實現創新是信息化發展的源動力。
(二)信息工程的知識化監理的內涵
信息工程的知識化監理,融合個人知識(經驗、專業、技術等)積累和企業知識(記錄、文檔、文化等)積累,使質量管理不僅僅停留在文檔化、參數化、流程化、制度化的作業中,而具有質的提高,促進個人知識和企業知識的相互轉化。
在監理過程中,促成業主與承建方、業主與監理方、業主與業主、承建方與監理方之間的知識轉移。在信息化建設中,由于業主缺乏相應的技術、知識、經驗等準備,監理的介入可以幫助業主與承建方溝通,了解承建方的技術路線、設計思想、公司實力、技術服務和支持等;幫助業主與已實施信息化的企業交流,學習經驗、吸取教訓、規避風險;提供對承建方的評價、解決方案的評價、項目實施方法的評價、項目階段和完成的評價以及技術服務和支持的評價等;提供風險管理、質量管理、進度管理、投資管理、安全管理、文檔管理等相應知識。在這個過程中,完成了多樣性、多方位、多層次的知識轉移。
信息工程監理在信息化工程中,通過實施零缺陷、戴明環、6σ等全面質量管理方法和ISO9000質量管理體系標準,提高對質量、質量管理的認識,形成以知識管理為基礎的質量管理作業流程,保證信息工程的質量。實現信息和知識資產的積累和保存,促進內部信息和知識的流通,達成組織內部知識的共享。
四、信息工程監理的知識結構
(一)信息工程監理的總體架構
信息工程監理的總體架構由5部分構成:⑴監理目標是信息系統工程總體目標和任務,包括五個階段,即項目孵化、規劃設計、項目實施、驗收測試和運行維護;⑵監理范圍,即監理職能×監理內容;⑶監理實施;⑷監理支撐;⑸系統評測。
(二)信息系統工程監理的知識結構
信息系統工程監理的知識結構,由5個維度的知識空間組成:
1.監理范圍。這個知識維度是由監理職能和監理內容構成的一個矩陣。監理范圍是信息系統工程監理知識結構的核心,其它知識元素都是以監理范圍為中心,輻射信息系統工程整個生命周期。
信息系統工程監理包含7項職能:決策與領導、規劃與設計、組織與人事、協調與溝通、控制與監督、投資、評測與創新。主要內容包括:質量控制、進度控制、投資控制、安全控制、知識產權控制、信息管理、合同管理、組織協調。
2.監理目標。與信息系統工程監理總體架構中監理目標是對應的。這個知識維度主要包含兩個內容:
(1)信息系統工程的總目標。這個總目標因項目的不同而存在差異。信息系統工程監理根據不同項目的特點,協助用戶在目標選擇、制定中,考慮系統的前瞻性、實用性、先進性、可靠性、安全性、業務流程重組或再造等。監理的目標就是支持和保證這個總目標成功實現。
(2)信息系統工程的任務。信息系統工程的主要任務包括項目孵化、規劃設計、項目實施、測試驗收、運行維護等。監理的目標就是保證工程項目各個階段任務目標、質量目標、進度目標、投資目標、安全目標、知識產權目標的順利實現。
3.監理實施。在這個知識維度中,根據工程的特點、用戶的需求、進度的安排、資金運用及相關條件等,并參照信息系統工程生命周期內的各個階段劃分監理實施各階段。監理的實施一般分為4個階段:前期準備、監理規劃、過程控制、監理結束。但監理實施的階段劃分并不一定與信息系統工程生命周期各階段有對應關系。
4.系統評測。這個知識維度強調信息系統工程生命周期中各個階段的質量評價、風險評估、安全評測等。評測是在監理范圍的知識維度內調控。
5.監理方法論。在監理范圍內,根據項目特點,為實現監理目標采用的知識原理、方法、設施、工具、法律、法規、標準、規范等的集合,是實施監理的依據和手段。
信息系統工程監理知識結構一般是按照各個維度的知識展開,但5個維度的知識不是相互孤立的,它們之間相互滲透、相互融合。由此構成信息系統工程監理知識空間。
信息工程監理,是我國獨特的項目管理約束機制。實施知識化監理,是項目管理的延伸和發展。監理單位應注重信息化過程中,在以信息資源規劃為核心的信息化規劃中展現的知識特點、知識結構和知識轉移等,注重企業內部外部的知識積累和共享,用知識指導監理。實現監理過程的知識管理,極大提高信息工程的質量。
[參考文獻]
[1]郎慶斌等.信息系統工程質量控制[M].人民出版社, 2005.7.
關鍵詞:質量功能展開(QFD) 模糊聚類方法 顧客需求
0 引言
質量功能展開(QFD)是一種基于顧客需求驅動的產品開發和質量管理方法,是將市場目標與工程要求聯系起來的最好的紐帶,體現了以市場為導向,以顧客需求為產品設計開發主要依據的指導思想。隨著QFD不斷深入的應用,人們發現傳統的QFD理論和方法不能有效的處理QFD中所需的模糊化或不確定性的數據信息,這些不確定性或模糊化的信息在傳統的QFD方法中都被當作精確的數據來處理,很有可能導致錯誤的決策,具有一定的局限性。而模糊理論卻在處理模糊的、非定量化的和不確定的信息方面顯示了強大的生命力。車阿大、林志航和方勇針對傳統QFD系統存在的不足,就把模糊理論應用于QFD中,并對其中的技術特性和核心思想進行了相關的研究。目前模糊理論主要是用在質量屋信息處理中,很少用于處理所獲得的顧客需求信息中,對如何分類使顧客需求信息更加清晰、合理、科學地對應技術特性方面,并未做深入的研究,針對這些不足,本文在獲得顧客需求信息的基礎上,重點研究模糊聚類方法在顧客需求信息分類中應用,并把這種方法應用于汽車安全帶的開發設計過程中。
1 顧客需求獲取過程的分析
顧客需求信息是指顧客希望產品的外觀、顏色、功能等能滿足自己現實或潛在的需求而要求產品具有某些方面特征和特性的情感訴求。在以顧客驅動為向導的產品設計開發中,顧客需求處于首要地位,是企業進行產品設計開發的主要出發點,是市場和企業之間的橋梁。QFD小組一般通過市場調研來獲取顧客需求信息,但顧客需求信息一般是零散、非技術性、不系統的,因此對獲取的信息進行整理時要量化顧客需求,即給出顧客對各質量特性的權重,為QFD在后期的規劃過程中進行決策和分配資源提供依據。在量化的基礎上,運用模糊聚類方法對顧客需求進行分類,避免人為分類過程中的主觀性、局限性和不確定性;最后對顧客需求信息進行整理、分析,從而得到產品總體的質量特性、零部件的質量特性、屬性等。
2 模糊聚類方法
模糊聚類方法是對觀察的對象在模糊環境下按即定要求進行分類的方法。該方法是建立在模糊理論基礎之上,模糊理論里的隸屬度是一個在[0,1]區間內取值的數,通過隸屬度的大小來劃分樣本。在數據挖掘過程中,有些數據具有不確定性,由不確定性產生的數據叫做模糊數據。由于數據描述的模糊性,經典數學不能精確表達,而這種模糊數據在現實生活中又是經常出現的。因此,在數據處理過程中,利用模糊理論來處理這種模糊問題。
2.1 模糊聚類方法的步驟 QFD小組一般通過市場調查獲取大量的顧客需求信息,并運用親和圖法從顧客語言需求信息中提煉出能夠代表這些信息的具體的顧客需求,然后對獲取的信息按其相互之間的親和性(相近性)來歸納整理這些資料,并使之分類的,這種方法的主觀性太大,分類不明確。但運用模糊聚類方法,在數量化的基礎之上對顧客需求信息進行分類,使得分類更加合理、科學。
2.1.1 建立模糊相似關系矩陣。用向量cri來表示第i個顧客的二級需求分類特征的取值。設有m個顧客的論域CR=(cri1,cri2,…,crim),每個顧客需求抽取n個特征crn=(cri1,cri2,…,crin),其中crij是第i個顧客需求對應于第j個特征的數值。就要計算出被分類對象間相似程度的系數rij,采用“絕對值減數法”來計算,只要0≤rij≤1(i,j=1,2,…,n)即可。當rij=0,則cri與crj毫無相似之處;當rij=1,則cri與crj完全相似或等同;當i=j時,則cri與crj是自己與自己相似,恒取值為1。由此可得到n×n階相似矩陣R=(rij)n×n。
2.1.2 求解傳遞閉包t(R)。由步驟(1)所得的模糊相似矩陣R一般僅滿足反身性和對稱性,而不滿足傳遞性。根據模糊理論,只有模糊等價關系才可以與普通等價關系相對應。因此,需要由傳遞閉包方法求出新的模糊等價矩陣,即R的傳遞閉包,記為t(R)。
2.1.3 求Rλ在論域上的普通等價關系Rλ,進行聚類分析。由模糊數學理論可知,論域上的模糊等價關系矩陣R,對任意λ∈[0,1],R對應的等價關系矩陣Rλ都是論域上的普通等價矩陣,而Rλ可以對論域進行劃分,當給定一個λ值,可得到一個Rλ,產生一種對論域的劃分;不同的 λ值,得到不同的Rλ,從而對論域的劃分也不相同。所以,可以根據實際需要選擇某一個λ值,進而實現對R的劃分。
2.1.4 分類。當R為模糊等價關系矩陣時,令λ從1到0變化,求出Rλ和論域的所有劃分。Rλ的具體計算方法為:當λij≥λ時,令λij=1;當λij
2.1.5 生成信息的分類圖。將上述2.1.4的聚類結果表達為顧客需求的分類圖。
2.2 模糊聚類方法的實例研究
2.2.1 分類指標的提取和顧客需求信息的向量表示。某汽車零配件公司在開發設計汽車安全帶時運用QFD對產品進行規劃和設計,并通過市場調查確定了11項顧客需求,分別為:安全帶尺寸小,節省安裝空間(cr1)、質量輕,減低總成質量(cr2)、強度高、耐磨,不易產生扭曲開裂(cr3)、清洗方便,不掉色(cr4)、材料耐高低溫、耐腐蝕(cr5)、適應于不同身材的人(cr6)、織帶長度調整方便,能夠收放自如(cr7)、帶扣結合或脫開快捷(cr8)、織帶拉出回收方便(cr9)、無氣味、無甲醛散發(cr10)、手感柔軟舒適,外觀平整(cr11)
通過對這些語言信息進行分析,用舒適性和方便性(D1)、耐久可靠性(D2)、靈敏性(D3)、環保性(D4)、小巧輕便性(D5)、適用性(D6)共六個特征指標作為一級顧客需求。根據每一顧客需求具有特性指標的程度,分別在[0,1]中取值,得出如下向量:cr1=(0.3 0 0.1 0 0.9 0) cr2=(0.3 0 0.3 0 0.9 0) cr3=(0 0.9 0 0 0 0) cr4=(0.3 0.8 0 0.1 0 0) cr5=(0 0.8 0 0.1 0 0) cr6=(0.3 0 0 0 0 0.9) cr7=(0.5 0 0.8 0 0 0) cr8=(0.5 0 0.9 0 0 0) cr9=(0.5 0 0.8 0 0 0) cr10=(0 0 0 0.9 0 0) cr11=(0.8 0 0 0 0 0)
2.2.2 建立模糊相似矩陣。為了對這些信息進行分類,通過“絕對值減數法”來計算rij,建立模糊相似矩陣。即:
rij=1-Ccr-cr,C=0.4(0≤rij≤1,i、j=1,2,…,11)。模糊相似矩陣R如下:R=rij=
1 0.92 0.12 0.24 0.12 0.24 0.28 0.24 0.28 0.12 0.40.92 1 0.04 0.16 0.04 0.16 0.36 0.32 0.36 0.04 0.320.12 0.04 1 0.8 0.92 0.16 0.12 0.08 0.12 0.28 0.320.24 0.16 0.8 1 0.88 0.28 0.24 0.2 0.24 0.24 0.440.12 0.04 0.92 0.88 1 0.16 0.12 0.08 0.12 0.36 0.320.24 0.16 0.16 0.28 0.16 1 0.24 0.2 0.24 0.16 0.440.28 0.36 0.12 0.24 0.12 0.24 1 0.96 1 0.12 0.560.24 0.32 0.08 0.2 0.08 0.2 0.96 1 0.96 0.08 0.520.28 0.36 0.12 0.24 0.12 0.24 1 0.96 1 0.12 0.560.12 0.04 0.28 0.24 0.36 0.16 0.12 0.08 0.12 1 0.32 0.4 0.32 0.32 0.44 0.32 0.44 0.56 0.52 0.56 0.32 1
2.2.3 求解傳遞閉包t(R)。使用最小最大法,通過計算得模糊相似矩陣R的傳遞閉包矩陣t(R):r(R)=RR=R2=
1 0.92 0.32 0.4 0.32 0.4 0.4 0.4 0.4 0.32 0.40.92 1 0.32 0.32 0.32 0.32 0.36 0.36 0.36 0.32 0.40.32 0.32 1 0.92 0.92 0.32 0.32 0.32 0.32 0.36 0.44 0.4 0.32 0.92 1 0.88 0.44 0.44 0.44 0.44 0.36 0.440.32 0.32 0.92 0.88 1 0.32 0.32 0.32 0.32 0.36 0.44 0.4 0.32 0.32 0.28 0.44 1 0.44 0.44 0.44 0.32 0.44 0.4 0.36 0.32 0.24 0.44 0.44 1 0.96 1 0.32 0.56 0.4 0.36 0.32 0.2 0.44 0.44 0.96 1 0.96 0.32 0.56 0.4 0.36 0.32 0.24 0.44 0.44 1 0.96 1 0.32 0.560.32 0.32 0.36 0.24 0.36 0.32 0.32 0.32 0.32 1 0.32 0.4 0.4 0.44 0.44 0.44 0.44 0.56 0.56 0.56 0.32 1
2.2.4 求Rλ在論域上的普通等價關系Rλ,進行聚類分析及分類。①λ=0.9。要判斷某幾項顧客需求如第i、j、k項二級顧客需求是否屬同一聚類,只要將Rλ中第i、j、k項行和第i、j、k列交叉處的元素提取出來,構成新的子矩陣,若該矩陣各元素都為1,則這幾項顧客需求屬同一聚類。
Rλ=1 1 0 0 0 0 0 0 0 0 01 1 0 0 0 0 0 0 0 0 00 0 1 1 1 0 0 0 0 0 00 0 1 1 0 0 0 0 0 0 00 0 1 0 1 0 0 0 0 0 00 0 0 0 0 1 0 0 0 0 00 0 0 0 0 0 1 1 1 0 00 0 0 0 0 0 1 1 1 0 00 0 0 0 0 0 1 1 1 0 00 0 0 0 0 0 0 0 0 1 00 0 0 0 0 0 0 0 0 0 1按此標準,λ=0.9時,汽車安全帶的十一項二級顧客需求被劃分為七個類別,即:{cr1,cr2},{cr3,cr4},{cr5},{cr6},{cr7,cr8,cr9},{cr10},{cr11}。②λ=
0.88。汽車安全帶的十一項二級顧客需求被劃分為六個類別,即:{cr1,cr2},{cr3,cr4,cr5},{cr6},{cr7,cr8,cr9},{cr10},{cr11}。③λ=0.36。汽車安全帶的十一項二級顧客需求被劃分為五個類別,即:{cr1,cr2},{cr3,cr4,cr5},{cr6,cr7,cr8,cr9},{cr10},{cr11}。④λ=0.3。汽車安全帶的十一項二級顧客需求被劃分為一個類別,即:{cr1,cr2,cr3,cr4,cr5,cr6,cr7,cr8,cr9,cr10,cr11}。
2.2.5 生成信息的分類圖。根據顧客需求聚類分析,生成信息分類如圖1所示。
圖1 信息分類圖
3 結論
本文在獲取顧客需求信息的基礎上,將模糊聚類方法應用于顧客需求信息的識別分類中,使得顧客需求的分類更加合理,汽車安全帶設計方向更為準確,顧客對產品的滿意度也大大提高。同時通過在汽車安全帶設計開發中,體現了模糊聚類方法在處理顧客需求模糊信息上的可靠性和科學性,為相關的企業在處理類似的信息時提供一個借鑒。
參考文獻:
[1]Karsak E E.Fuzzy Multiple Objective Programming Fram-
ework to Prioritize Design Requirements in Quality Function Deployment[J].Computers&Industrial Engineering,2004,47(23):149-163.
[2]熊偉.質量機能展開[M].北京:化學工業出版社,2005.3.
[3]車阿大,林志航.改進的質量功能配置——模糊質量功能配置[J].系統工程理論與實踐,1998,18(4):131-135.
[關鍵詞] 物料編碼 管理 編制原則 應用
引言
當今社會已進入信息化時代,企業面臨的市場競爭日益激烈,為了提高競爭能力,企業進行信息化建設極為重要。對中農機美諾來說,引入ERP(企業資源計劃)已成為大勢所趨。在實施、應用ERP系統過程中,物料編碼(簡稱物料編碼)的編制是一項最為基礎和工作,它的好壞將直接決定ERP系統的成敗,也將持續的影響企業未來信息化建設的發展。
物料信息編碼設計是提升企業綜合實力的有效途徑。對于企業,物料的信息編碼設計是重中之重,好的物料代碼編制規劃可以大大提高識別的準確性,降低信息錄入強度,提高識別反映速度,減少因擴容造成的重復建設投入。研究物料編碼的理論和方法,對做好信息分類編碼設計工作具有重要的指導意義。
一、物料編碼編制原則
不同企業物料編碼的模式大致有以下兩種:一種是順序編碼,比較簡單,完全用流水號的方法給每一種物料賦予一組惟一的阿拉伯數字,這組數字不包含該種物料的任何屬性信息,僅用以區分物料;一種是賦義編碼顧名思義是賦予編碼一定含義。這種編碼常用的是層次碼和屬性碼。層次碼可以表達物料的統計上的卷疊要求;屬性碼可以表達物料的配置要求。很多早期實施物料編碼的企業在從人工操作向計算機ERP系統過渡時大多采用這種模式。物料編碼主要具有如下特征:
1.惟一性:保證一個編碼對象賦予一個代碼,一個代碼只反映一個編碼對象。由多個對象組合形成的新的對象也應由于其獨立的使用價值而獲得獨立的代碼。
2.簡練性:代碼位數盡可能少,盡可能只使用阿拉伯數字,減少錄入工作量和錄入差錯。
3.穩定性:盡可能保持代碼系統的穩定,盡量不要在代碼中賦予人為判斷的信息。
中農機美諾公司物料編碼由一組6位阿拉伯數字代表一種物料,構成形式是:
組織代碼(1位)+流水碼(5位)。物料編碼的組織代碼是2,如圖所示。
二、物料編碼管理模式
中農機美諾公司物料編碼是ERP系統對物料的惟一識別代碼,在ERP系統中,是財務部門、庫房、采購部門、技術部門、生產部門、配件等部門全面使用的統一的物料編碼。
公司設立了授碼中心,對全公司的物料統一授碼、維護和管理,授碼中心設置在生產技術部。各物料編碼使用部門根據需要統一向授碼中心申請,新碼使用、錯碼糾正和廢碼停用等統一由授碼中心統一管理。具體的管理流程見下表。
三、物料編碼方法的主要作用
1.物料信息編碼是人們賦予事物一定規律性的、易于人或計算機識別和處理的符號。目的是為了適應ERP系統運行和處理,便于各子系統之間的信息集成與共享。
2.通過建立編碼規則,在企業范圍內對數量龐大、種類繁多的數據信息進行統一標識,唯一識別,對產品數據其它屬性進行合理規劃,可有效解決設計人員、工藝人員和生產管理人員之間因為物料表達不明確而存在的問題。
3.目前,大多數農機企業物料庫中原材料的可選范圍、數量往往超出企業產品實際所需范圍,通過物料編碼,借助ERP系統,在滿足產品功能和設計要求的前提下,對企業原有物料庫進行優化、篩選,使設計人員盡可能選用經過篩選和編碼的原材料,不僅可以減少前期物料編碼的工作量,還可避免設計選料的隨意性,防止原材料積壓,減少企業采購成本,提高資金的利用率。
四、舊物料編碼存在的問題
在使用統一物料編碼前,美諾公司各體系有一套自己的物料標示方法,財務部門按照ERP系統自動生成的編碼確認為物料編碼,是一個十余位的數字加字母的代碼。生產和技術體系在使用標示物料在整機中裝配關系的圖號。銷售體系使用產品名稱加備注來說明要銷售的商品。上述代碼體系長期以來一直在維持業務的運行,但不斷出現如下問題:
1.一個制件經過歷年改圖但圖號仍然是原來的圖號,倉庫里經常發現同一圖號但已經完全不同的制件,造成領用錯誤。
2.在售后服務配件業務中,客戶較難記憶和準確提供所需配件的圖號,經常是描述配件位置后由服務人員轉化為圖號,在信息傳遞過程中圖號中復雜的符號(如“-”、“.”、“/”)等一旦丟失或漏寫就會造成配件發送錯誤。
3.對一些客戶需要配件的舊機型,單一使用圖號無法確認制件,還需要有經驗的技術或生產人員翻查歷史圖紙或進庫辨認,經常造成工作反饋慢,或者出現錯誤。
4.供應商和美諾公司倉庫內制件圖號標示、規格型號和名稱(經常造成大名、小名混淆)都無法實現標示的惟一性,造成一個圖號多種實物等情況,查找物料需要庫管員有很強的業務經驗。
5.物料入庫出庫輸入信息復雜,容易造成錯誤領用和入庫,使成本和庫存失準。
五、新物料編碼方法的主要特點
針對以上問題,美諾公司編制了一套適合本公司物流管理的新的代碼方法。該方法具有如下特點:
1.代碼具有惟一性,且錄入效率高:美諾物料編碼采用順序碼模式,六位數字不包含人為判定因素,通過統一授碼機構管理,可確保物料的唯一性;與圖號和原有財務自動生成的代碼相比,現有代碼簡單,錄入工作量降低80%以上,對批量業務重復錄入效果更明顯。同時大大降低錄入錯誤率,提高了系統正確識別的效率。
2.便于在制件上標示:只有物料編碼標示在每一制件上,才能完全實現物料的正確識別,確保識別效率和準確性。2009年開始,美諾公司所有物料進廠均根據物料特點實現了標示,很多制件的代碼以永久刻畫或磨具方式體現,現有簡練的物料編碼減少了供方標示難度和成本,確保了這項工作的落實。另外,圖號包含有部分技術信息,可以借助圖號理解制件在產品中的位置和相互關系,是一種很有價值的商業信息。這些信息流出企業,存在被競爭對手利用的可能。用不包含任何信息的物料編碼代替可以確保企業的安全。
3.提高用戶滿意度:結合ERP系統的工程BOM表使用,使同一型號機型在不突破國家補貼許可政策的前提下實現細微差異的標示,即使同一機型也可以通過整機物料編碼的標示加以準確區分,使銷售體系實現多配置定制化銷售成為可能;結合零部件圖冊、ERP系統和制件上的物料編碼標示,確保服務配件供應準確性,用戶只要能夠準確讀出故障件上的6位數字(物料編碼),或者能夠通過圖冊識別出相對應的物料編碼,告訴配件服務人員即可。
4.提升供應鏈管理水平:現代化的物料倉儲管理需要對倉庫貨位、物料編碼進行準確標示和快速識別,進行統一物料編碼標示是實現貨位、物料編碼條碼管理的基礎,實現條碼管理則可以實現快速盤點(實時盤點),定位倉管(送貨到貨位),甚至自動倉庫提供可能性。
5.未來庫存管理的趨勢是壓縮庫存甚至零庫存,轉而以供方倉庫和第三方物流二次配送取代,要求美諾公司的物料編碼體系必須簡練和準確,原有拗口復雜且無法統一的標示,要求倉管人員具有很高的經驗水平,這是實現社會化倉管或第三方倉管的障礙。實施美諾物料編碼體系可以大大降低對倉庫管理員識件經驗的要求、減少重復庫存發生幾率、預防呆料廢料,盡早實現倉管工作的現代化。
六、結論
開展信息化建設是提升企業綜合實力的有效途徑。企業必須走信息化帶動工業化,工業化促進信息化之路。美諾在開展信息化建設工作中認識到,做好信息分類編碼設計工作,是信息化建設成功的至關重要的第一步。對于企業,物料的信息分類編碼設計是重中之重,研究其理論和方法,對做好信息分類編碼設計工作具有重要的指導意義。
在進行信息化建設中,要重視和做好物料編碼的工作,提高數據的準確性,把數據的錯誤率控制在可接受的范圍之內,并逐步求精。同時,要制定一套高效的管理制度。當今社會在不斷變化,企業為了更好的適應市場、占領市場,必須進行信息化建設。今后也必將有更多的企業實施ERP,希望本文所提到的一些有關中農機美諾企業物料編碼方面的經驗能夠為其它農機企業提供借鑒和參考。
參考文獻:
[1]翁衛東 高文金 肖行波:機械制造企業ERP系統中物料代碼的編制[J].石油機械,2005,33(12)
[2]劉建華:淺談企業內部現代物流管理系統的建設[J].人民長江,2006,37(6)
[3]江萬軍 薛惠鋒 寇曉東:物料編碼系統解決方案在ERP實施中的應用[J].冶金設備,2005(8)
[4]劉學明 李振忠 張廣義:物料信息分類編碼設計[J].鍋爐制造,2004(3)
[5]舒 麗 陳克榮:產品分類編碼的編碼規則探討[J].科學之友,2008(8)
[6]鄭緯琳:企業標準件物料編碼規則[J].經驗交流,2006
1、信息分類的原則。信息分類標準化是對信息進行理解、收集、存儲、傳輸和顯示自動化管理的前提。風景區控規信息分類應遵循科學性、系統性與擴充性原則。科學性:風景區控規信息分類應適應現代計算機、地理信息系統和數據庫技術對數據進行管理和應用的要求。系統性:風景區控規信息分類應按照合理的順序排列成一個系統的有機整體,既反映不同規劃間的區別,又反映上下層次規劃間的聯系,提供擴充的可能性。擴充性:在確定分類體系時,既要考慮目前的需要和技術水平,也要對未來的科學技術有所預見。
2、風景區控規的信息內容。風景區控規信息即控規編制所涉及的一切內容,其表現形式是控規編制的成果。風景區控規成果最終包括文檔和圖紙兩個部分。文檔類指標形成了控規成果中的文檔信息,圖形類指標則形成了圖紙信息。數據屬性類指標為文檔信息,部分需利用圖紙表現。如用地面積、建筑高度、建筑密度等數據信息既要在文檔中說明,也要在圖紙中反映。風景區控規中的文檔應該包括文本和附件兩個部分,其中文本包括總則、通則和附則,附件則包含控規說明書和基礎資料。基礎資料應包括:已批準的風景區總體規劃或分區規劃對本規劃地段的規劃要求,相鄰地段已批準的規劃資料;土地利用現狀;公共設施規模及分布;工程設施及管網現狀;土地經濟分析資料,包括有償使用狀況、開發方式等;人口分布現狀;所在地區歷史文化傳統、建筑特色、地方志等資料。風景區控規圖紙應包括地形圖、規劃區位圖、用地現狀圖、用地規劃圖、道路交通及豎向規劃圖、工程管網規劃圖、各種分析圖、居民調控圖及控制性規劃圖則等。
二、風景區控規信息系統的需求分析
需求指用戶對目標軟件系統在功能、行為、性能、設計約束等方面的期望。風景區控規信息系統的系統需求分析是實現其控規信息系統的功能和用戶需求的重要階段,直接影響系統性能。
1、用戶需求。
(1)日常業務辦公流程的輔助處理。實現計算機對業務的輔助處理,使景區業務人員可以方便、快捷地得到需要的信息,提高工作效率。管理人員可以通過計算機全面了解工作情況,最終建立有機綜合信息的資源,從文檔和圖紙兩方面實現對各項業務的輔助辦公,提高業務管理的科學化水平。
(2)圖文一體化的系統實現。在建設各類基礎信息庫的基礎上,建立圖文一體化的控規信息系統,以圖形系統為基礎,疊加各種圖形及文檔信息。用戶可以方便地通過圖形對景區功能分區、項目設置及其意向形成直觀的認識,同時直觀地了解各地塊的信息,宏觀掌握規劃區的情況。
(3)與相關部門信息數據庫的聯接和信息交互。系統可通過互聯網等技術同相關管理部門建立數據傳遞機制,將各級管理部門的數據通過網絡上報,并在授權后查詢整個部門內的數據庫信息。
2、需求分析。風景區控規信息系統的主要需求有兩方面:一是公文辦公的流程化處理;二是建立若干信息數據庫,對辦公中所涉及的各種文檔及圖形信息進行統一存儲,并提供方便的查詢、統計、編輯手段。
(1)系統網絡需求。采用瀏覽器和客戶端B/S結構的方式,在廣域網或局域網內實現信息共享及網絡化辦公;在互聯網上公示控規成果,可以查詢相關圖紙和各個地塊的屬性。
(2)公文流程化處理。主要實現業務部門內部的日常文件轉收、業務請示、公文寫作及公文發放等工作的計算機輔助辦公;提供靈活的公文流程,各級傳輸過程收錄用戶意見,并進行具體處理;將各業務科室的數據信息納入信息系統,建立公用信息等一切數據表格。
(3)建立各類文檔管理數據庫。應配合公文處理、各項業務的辦公情況、行業情況及文件法規庫等信息的管理而建立相應的信息數據庫。業務文檔數據庫:規劃審批日常的文件、業務請示以及公文等;空間信息數據庫:控規所有的圖形要素等;信息數據庫:系統高級別用戶制作的控規成果及相關統計分析的專題信息等。
(4)相關接口的預留。系統保留了相關數據接口,各種邏輯功能高內聚、低耦合,每個功能模塊設計為接受若干參數后進行內部邏輯和數據處理并返回結果,因此方便調用或為其他相關部門提供常用格式的功能和數據,并具備繼續開發的潛力。
三、控規管理信息系統的設計
1、案例背景。太極洞風景名勝區位于安徽省宣城市廣德縣,包括太極洞片區和盧湖片區兩部分。太極洞片區位于廣德縣東北,北起分界嶺、青頭山、三洲山,南至小獅山、后座山及將軍山南麓,東至皖浙邊界的火燒山、人頭山、金鐘嶺與大洪山,西沿四季卡、路青卡及橡皮烘,總面積22平方公里,其中在安徽省境內面積14.4平方公里、江蘇省境內3.6平方公里、浙江省境內4平方公里。太極洞片區規劃范圍僅為其核心部分,面積約383.8公頃。盧湖片區北起七里店,南至陳塢村,東至甘溪溝,西臨笄罩山,包括盧湖、笄罩山、甘溪溝及靈山等地區,總面積71.87平方公里。盧湖片區規劃范圍僅是其核心部分,面積約671.12公頃,其中陸地面積約497.17公頃,盧湖水面面積約200.67公頃。
2、系統使用環境和結構設計。系統使用環境包括硬件環境、軟件環境和網絡環境。硬件環境:控規信息系統主要運行在微機系統上,主要的硬件資源除辦公用機和服務器之外,還包括數據輸入/輸出設備、數據存儲和處理設備及相關輔助設備等。軟件環境:Windows系列操作系統,ArcView3.2版本以上,MSOffice2000以上版本。網絡環境:局域網建議為100兆帶寬,廣域網為VPN連接。
風景區控規管理信息系統的結構設計包括五個層面。基礎平臺選型:包括硬件系統與操作系統軟件選型;數據層設計:包括文檔數據庫、空間圖片數據庫及用戶數據庫等;應用軟件層選擇:包括信息系統軟件與其他應用程序;應用模塊層設計:包括系統配置管理模塊、基本管理模塊、規劃成果管理模塊以及相關接口預留模塊等業務邏輯功能;圖形界面層設計:按照便于應用的原則,采用直觀的圖形用戶界面。
3、系統使用過程。
(1)用戶登錄。本系統針對的是網絡客戶端,用戶無需安裝任何軟件,將其在IIS服務器后輸入IP地址或域名便可進入該系統的用戶登錄界面。
(2)規劃選擇。由于一個用戶可能會參與多個控制性規劃的編制,該系統在用戶登錄后會要求用戶選擇一個系統中已儲存的規劃項目。如系統中沒有用戶所需規劃,用戶可選擇“建立一個新規劃”建立需要的規劃項目。
(3)瀏覽查詢。以游覽項目總平面圖為例,界面中部為用戶查詢的結果(包括文檔和圖紙),右邊為屬性欄,顯示與改圖紙相關聯的屬性信息。當用戶將鼠標移至游覽項目總平面圖上的游覽項目紅點時,右邊的屬性欄會出現該景點的文字介紹和景觀意向圖等信息。用戶如需對查詢圖紙放大、縮小、測量坐標或測量面積等,可調用功能菜單“ArcView作”中的相關功能,單擊即可。
(4)文檔與屬性操作。用戶如需修改文本文件、圖紙屬性信息或錄入圖像及上傳附件,單擊功能菜單“規劃錄入”中的相關按鈕,界面會調用已開發的Tinymce.js編輯器模塊進行文檔文本信息錄入。它可以保證錄入信息按HTML編碼存入數據庫,調用Uploadfile組件進行附件上傳與圖像上傳功能。
(5)圖像坐標及標示操作。以游覽項目總平面圖為例,如要在圖上添加停車場圖標,用戶在下拉表中選中停車場,在游覽項目總平面圖上雙擊需要添加標示坐標的區域便可在圖上繪制出該點的坐標層;調用功能菜單中“ArcView操作”便可得到坐標點,將坐標點保存到數據庫中便可以調用顯示。
(6)Google接口調用。用戶可單擊功能菜單中的“Google地圖”按鈕,將本系統圖與在線地圖服務GoogleMap/Earth對接,以GoogleMap/Earth為平臺提供太極洞風景資源分布衛星圖。
四、結語
上述案例展示了太極洞風景區控規管理信息系統的使用過程和多個界面。該系統依據太極洞風景名勝區的業務管理特征,將景區內的自然資源、文化資源、社會經濟、總體規劃等空間信息與屬性信息進行綜合管理,輔助管理部門業務管理,提高管理效率。本文所建立的綜合性業務管理信息系統致力于滿足風景名勝區控制性規劃管理的業務需求和服務社會的需求,在風景名勝區規劃管理信息系統的數據管理與應用功能開發方面進行了實踐。