檔案館數(shù)字化、數(shù)字化檔案館、數(shù)字檔案館
關(guān)于檔案館數(shù)字化建設(shè)的思考
201*-11-9網(wǎng)友評論0條點(diǎn)擊進(jìn)入論壇
當(dāng)二十世紀(jì)的尼葛洛龐帝(NicholasNegroponte)在《數(shù)字化生存》(BeingDigital)一書中,向人們描述著數(shù)字時(shí)代對我們的生活方式、工作方式甚至思維方式帶來的各種沖擊時(shí),人類文明已經(jīng)真實(shí)地邁進(jìn)了二十一世紀(jì),數(shù)字化信息時(shí)代的大潮朝著我們撲面而來。檔案管理和利用如何應(yīng)對及適應(yīng)數(shù)字化信息時(shí)代的需求,是我們檔案工作者要思考的。
一、傳統(tǒng)檔案館的數(shù)字之路
201*年12月,國家檔案局、中央檔案館印發(fā)的《全國檔案事業(yè)發(fā)展“十五”計(jì)劃》,把“加快檔案信息化建設(shè)”、“加快現(xiàn)有檔案的數(shù)字化進(jìn)程”列入其中,同月國家檔案局在中國檔案管理現(xiàn)代化建設(shè)研討會上宣布:十五期間,我國將加快數(shù)字化檔案館的建設(shè)。由此,傳統(tǒng)檔案館數(shù)字化建設(shè)的問題引起了人們的關(guān)注,并且有一些檔案館已經(jīng)開始對此投資建設(shè)。我們認(rèn)為,傳統(tǒng)檔案館的數(shù)字之路并非一蹴而就,而是一個(gè)循序漸進(jìn)的過程,對這個(gè)過程的各個(gè)環(huán)節(jié)進(jìn)行深入的分析研究是十分必要的,只有在有了清楚認(rèn)識的基礎(chǔ)上,才能規(guī)劃和解決好檔案館的數(shù)字化之路,為今后的數(shù)字化檔案館進(jìn)而是數(shù)字檔案館、虛擬檔案館的建設(shè)打好基礎(chǔ)。
傳統(tǒng)檔案館的數(shù)字之路由三個(gè)相互聯(lián)系的階段組成:(一)檔案館數(shù)字化。檔案館的數(shù)字化包含著以下三層含義,其一是隨著計(jì)算機(jī)技術(shù)的引入,建立檔案館的自動化系統(tǒng),實(shí)現(xiàn)檔案館自動化管理,完成檔案管理的數(shù)字化;其二是館藏信息數(shù)字化,數(shù)字化的館藏檔案信息能直接被計(jì)算機(jī)識別和處理,建成完備的信息數(shù)據(jù)庫;其三是構(gòu)建平滑高效的檔案信息數(shù)字化傳輸平臺,實(shí)現(xiàn)檔案的統(tǒng)一管理和資源共享。(二)數(shù)字化檔案館。在檔案館數(shù)字化基礎(chǔ)上,形成以數(shù)字化信息為館藏內(nèi)容,以計(jì)算機(jī)為管理手段,以網(wǎng)絡(luò)傳遞為利用方式的一種新型檔案館,是采用現(xiàn)代高新技術(shù)的數(shù)字信息資源系統(tǒng)。(三)數(shù)字檔案館。通過國家信息基礎(chǔ)工程聯(lián)合數(shù)字化檔案館,運(yùn)用網(wǎng)絡(luò)互聯(lián)技術(shù),將個(gè)體數(shù)字化檔案館聯(lián)合起來,進(jìn)行擴(kuò)張、伸展,組成完全意義的數(shù)字檔案館,遵循共同協(xié)議,實(shí)現(xiàn)數(shù)字化信息共享,是超大規(guī)模的、便于使用的、沒有時(shí)空限制的知識信息中心。用戶可以通過網(wǎng)絡(luò)計(jì)算機(jī)終端提出需求,由數(shù)字檔案館系統(tǒng)完成查找和調(diào)閱檔案信息,完全不受時(shí)間和地理?xiàng)l件的限制。如果說運(yùn)用虛擬技術(shù),建立虛擬檔案館的話,那么,檔案館發(fā)展到第三個(gè)階段,才真正可以稱得上是虛擬檔案館。
二、檔案館數(shù)字化數(shù)字化的起點(diǎn)
檔案館的數(shù)字化建設(shè)作為傳統(tǒng)檔案館數(shù)字之路的起點(diǎn),如何走好這首要一步,就顯得至關(guān)重要。為此我們就著重于這一點(diǎn)來談一下我們的觀點(diǎn)。
計(jì)算機(jī)技術(shù)的普及,為檔案館數(shù)字化建設(shè)奠定了良好的基礎(chǔ)。檔案館數(shù)字化建設(shè)包含以下幾個(gè)方面:
(一)檔案管理的數(shù)字化。檔案管理自動化是對檔案館自身管理行為現(xiàn)代化的確定,而這種現(xiàn)代化是建立在計(jì)算機(jī)數(shù)字化管理基礎(chǔ)上的。這個(gè)特征是基礎(chǔ)性的,有普遍意義的,是開展其他數(shù)字化工作的前提條件。現(xiàn)在許多文章在探討數(shù)字檔案館或虛擬檔案館時(shí),較多是對檔案館美好前景的預(yù)測與憧憬,很少涉及傳統(tǒng)檔案館的現(xiàn)代化管理問題,忽視檔案管理具體業(yè)務(wù)環(huán)節(jié)的計(jì)算機(jī)數(shù)字化管理問題,如檔案自動編目和自動檢索、檔案自動全文存儲與檢索、檔案業(yè)務(wù)工作輔助管理、計(jì)算機(jī)輔助立卷、檔案自動標(biāo)引、文檔一體化管理、檔案館辦公自動化、檔案庫房保護(hù)技術(shù)現(xiàn)代化、檔案數(shù)據(jù)庫設(shè)計(jì)與建立等。而這些不僅是檔案管理基本的業(yè)務(wù)環(huán)節(jié),也是檔案管理自動化的具體體現(xiàn),更是檔案管理數(shù)字化全面實(shí)現(xiàn)的基礎(chǔ)。這些問題不解決,檔案館數(shù)字化建設(shè)就是“空中樓閣”,無從談起。
20世紀(jì)90年代以來,我國各級各類檔案館開始進(jìn)行檔案管理數(shù)字化的實(shí)踐與探索,大致可以歸納為三方面的發(fā)展方向。1、建立著錄檔案信息檢索系統(tǒng)。著錄檔案信息檢索系統(tǒng),應(yīng)該說是計(jì)算機(jī)技術(shù)與檔案工作的最早結(jié)合點(diǎn)。由于檔案館的館藏量巨大,檔案的信息資源又是如此豐富多樣,為了方便利用者,提高查詢效率,檔案館利用計(jì)算機(jī)技術(shù)進(jìn)行檔案目錄或?qū)n}文件級目錄著錄,以達(dá)到快速檢索的目的,檢索工具的數(shù)字化帶來的優(yōu)勢盡顯無遺。2、“文檔一體化”管理。1992年國家檔案局提出“文檔一體化”管理思路,許多檔案部門紛紛嘗試?yán)糜?jì)算機(jī)技術(shù)實(shí)現(xiàn)文件與檔案的一體化管理,從文件形成之時(shí)到文件辦結(jié)歸檔乃至檔案管理成為一條流水線的操作過程!拔臋n一體化”操作管理軟件與傳統(tǒng)手工操作相比,避免應(yīng)歸檔的文件材料人為遺漏,提高了文件歸檔的完整性和準(zhǔn)確性,提高了文件立卷的效率,提高了檔案的質(zhì)量。但它也只是利用計(jì)算機(jī)技術(shù)來模擬傳統(tǒng)手工操作流程,不是真正意義上的文檔管理數(shù)字化。3、檔案館數(shù)字化管理系統(tǒng)的建設(shè)。我國檔案工作數(shù)字化管理起步時(shí)間較晚,目前還是以針對上述檔案信息檢索系統(tǒng)和文檔一體化數(shù)據(jù)庫系統(tǒng)的管理為主,停留在檔案工作數(shù)字化管理的初級階段,數(shù)字化管理的優(yōu)勢和潛能并未充分發(fā)掘出來。檔案工作數(shù)字化管理系統(tǒng)實(shí)際上是一個(gè)可以涵蓋檔案館行政管理和業(yè)務(wù)管理、檔案信息開發(fā)利用工作等諸方面的大型的系統(tǒng)工程。檔案館數(shù)字化管理應(yīng)該以此為契入點(diǎn),朝著這個(gè)方向積極發(fā)展。
(二)館藏信息的數(shù)字化。根據(jù)《檔案法》的規(guī)定,綜合性檔案館作為黨和國家的科學(xué)文化事業(yè)機(jī)構(gòu),是永久集中保存檔案的基地,與國家歷史同在。綜合性檔案館通常都有數(shù)量龐大的館藏,內(nèi)容及形式也是豐富多樣的。就傳統(tǒng)的檔案載體而言,其記錄信息都是平面的,文字、圖像、聲音等不同載體的信息難以有機(jī)地結(jié)合起來。通過運(yùn)用計(jì)算機(jī)技術(shù)與多媒體技術(shù),所有的館藏信息都能以數(shù)字化的形式存儲,做到圖、文、聲并茂,檔案信息的記錄功能與顯示功能得到了極大的強(qiáng)化;而且更有前景的是數(shù)字化后的檔案信息能隨心所欲地從一種媒介轉(zhuǎn)換到另一種媒介,給長期以來沉悶、形式單一的檔案信息貼上吸引人的“標(biāo)簽”。館藏信息的數(shù)字化是檔案館數(shù)字化建設(shè)的核心,其數(shù)字化建設(shè)的工程量巨大,各級檔案部門應(yīng)根據(jù)自身特點(diǎn)采取不同的建設(shè)模式:1、大型綜合性檔案館,它們的館藏基礎(chǔ)一般都較好,館藏信息的利用也較頻繁,在建設(shè)經(jīng)費(fèi)充足的情況下,可以采取技術(shù)優(yōu)先的原則,劃出專項(xiàng)經(jīng)費(fèi),成立館藏信息數(shù)字化部門,專門負(fù)責(zé)檔案信息數(shù)字化工作。這種模式見效快,但投入高,需要很強(qiáng)的經(jīng)濟(jì)支持和技術(shù)支持。2、中小型綜合檔案館,在建設(shè)經(jīng)費(fèi)不夠充足的情況下,可以采取資源優(yōu)先的原則,購置少量的設(shè)備,對重要的檔案資源先期進(jìn)行數(shù)字化處理,循序漸進(jìn)逐步擴(kuò)大數(shù)字化規(guī)模。這種模式見效慢,投入較少,對技術(shù)要求也不高。館藏檔案信息經(jīng)數(shù)字化后轉(zhuǎn)化為數(shù)字信息,以數(shù)據(jù)庫的形式存在。
目前大部分檔案館館藏檔案載體仍然是以紙質(zhì)為主,紙質(zhì)檔案數(shù)字化制作方式一般有二種:第一種是通過計(jì)算機(jī)人工錄入或通過掃描儀掃描由字符識別軟件(OCR)識別,制成文本文件;第二種是將檔案文件的每一頁看成是一張圖片,不管上面具體是什么內(nèi)容,由掃描儀按頁掃入計(jì)算機(jī)制成圖形文件。第一種方式占據(jù)空間小,是一種真正意義上的全文數(shù)字化,但紙質(zhì)檔案信息的記錄方式是多種多樣的,有的是手寫體、繁體字,有的字跡褪化及非文字形式等,此時(shí)采用第一種方式就會暴露出如下致命弱點(diǎn):用OCR字符識別的準(zhǔn)確率低;若采用人工錄入,不但需要大量的錄入人員,而且一時(shí)還不能馬上勝任此項(xiàng)工作,差錯(cuò)率大且核對困難,投入大,收效慢。而第二種方式實(shí)現(xiàn)容易,一般檔案工作人員只要稍加培訓(xùn),即可操作機(jī)器,且工作可以定量化,差錯(cuò)率相對較低,即便有一些錯(cuò)掃、漏掃等,也能很快被發(fā)現(xiàn)。至于圖形文件占空間大的問題,在計(jì)算機(jī)技術(shù)日新月異的今天,相信適合的軟件很快就會被開發(fā)出來,如果能采用先進(jìn)的高速掃描機(jī),那么對檔案信息數(shù)字化無疑是如虎添翼。另外,還因?yàn)閳D像掃描保持了檔案原件本來面目,可以使利用者在看到文字內(nèi)容的同時(shí),也能看到紙質(zhì)檔案的其它一些特征,如原件的紙色、墨跡、印章、圈點(diǎn)、批注等各種原貌,使利用者可以獲得更多的線索,開展一些更深入的研究。
(三)檔案信息傳輸平臺數(shù)字化。檔案信息只有在傳遞過程中才能體現(xiàn)出它應(yīng)有的價(jià)值,以往信息存在于一次文獻(xiàn)即檔案原件或經(jīng)過處理的二次文獻(xiàn)范疇內(nèi),人們需要檔案信息,往往需要親臨檔案館,通過閱覽摘錄、靜電復(fù)制或拍攝等形式來獲取需要的信息。但檔案信息在完成數(shù)字化后以數(shù)字形式存在時(shí),數(shù)字網(wǎng)絡(luò)系統(tǒng)就將成為其主要的傳輸平臺,為檔案信息的快速流動提供可能。數(shù)字化了的檔案信息在傳遞過程中可以同時(shí)進(jìn)行多向傳遞,形成傳遞網(wǎng)絡(luò),而且通過因特網(wǎng)可以方便地進(jìn)行遠(yuǎn)程傳遞,不受時(shí)間與空間的限制,利用者不必親臨檔案館,就可以在任何時(shí)間任何地點(diǎn)通過計(jì)算機(jī)方便地利用檔案信息。
如果把檔案館數(shù)字化建設(shè)比作一個(gè)人體的話,那么檔案管理數(shù)字化和館藏信息數(shù)字化的建設(shè)就是這個(gè)人體的骨架和血肉,數(shù)字網(wǎng)絡(luò)系統(tǒng)就是它的神經(jīng)網(wǎng)絡(luò)。檔案館信息傳輸平臺應(yīng)首先構(gòu)建的是檔案館局域網(wǎng)也可稱為內(nèi)網(wǎng),一般的要求是在遵循統(tǒng)一的通信協(xié)議前提下,通過網(wǎng)絡(luò)連線將各個(gè)部門的計(jì)算機(jī)資源整合在一起?筛鶕(jù)不同的應(yīng)用設(shè)置服務(wù)器,部門的個(gè)體計(jì)算機(jī)通過網(wǎng)絡(luò)共享網(wǎng)絡(luò)信息資源,為檔案館核心數(shù)據(jù)庫提供檔案信息,也可以得到權(quán)限范圍內(nèi)的檔案信息。其次是構(gòu)建外網(wǎng)、公眾網(wǎng)等,可使檔案信息通過數(shù)字網(wǎng)絡(luò)系統(tǒng)進(jìn)入信息交流的大動脈----互聯(lián)網(wǎng),實(shí)現(xiàn)檔案資源的共享。
三、檔案館數(shù)字化建設(shè)需要注意的幾個(gè)方面
(一)建立標(biāo)準(zhǔn)化的規(guī)范體系!吨腥A人民共和國標(biāo)準(zhǔn)化管理?xiàng)l例》指出:“標(biāo)準(zhǔn)化是組織現(xiàn)代化生產(chǎn)的重要手段,是科學(xué)管理的重要組成部分,在社會主義建設(shè)中推行標(biāo)準(zhǔn)化,是國家的一項(xiàng)重要技術(shù)經(jīng)濟(jì)政策!边@充分闡明了標(biāo)準(zhǔn)化的地位和作用。現(xiàn)在各地的檔案館對數(shù)字化建設(shè)還都處在試驗(yàn)和探索階段,采用的方式方法也不盡相同,因此在檔案館數(shù)字化建設(shè)中,標(biāo)準(zhǔn)化的規(guī)范體系的確立就顯得尤為重要,它是檔案館數(shù)字化建設(shè)高質(zhì)量的堅(jiān)實(shí)基礎(chǔ)。如浙江省檔案局指出數(shù)據(jù)庫建設(shè)要本著保證質(zhì)量、規(guī)范標(biāo)準(zhǔn)的精神,并決定在201*年正式出臺統(tǒng)一的《浙江省綜合檔案館電子目錄數(shù)據(jù)庫結(jié)構(gòu)與交換格式》相關(guān)標(biāo)準(zhǔn),對全省各級檔案館現(xiàn)有的數(shù)據(jù)庫與軟件進(jìn)行修改、規(guī)范,提高數(shù)據(jù)質(zhì)量,完善軟件功能,特別是數(shù)據(jù)標(biāo)準(zhǔn)接口功能。在建立標(biāo)準(zhǔn)化的規(guī)范體系方面我們應(yīng)遵循以下原則:
1、以標(biāo)準(zhǔn)化管理為主,制度管理為輔。標(biāo)準(zhǔn)化適合于技術(shù)工作領(lǐng)域的規(guī)范化管理,可操作性強(qiáng),而且與管理體制的關(guān)系較為超脫,因此在不與法律相沖突的情況下,標(biāo)準(zhǔn)化管理更有利于不同部門之間的協(xié)調(diào)。制度通常以法規(guī)形式出現(xiàn),特別是約束力強(qiáng),但管理范圍有限,所以在標(biāo)準(zhǔn)化管理的基礎(chǔ)上,配合制度可以形成檔案館數(shù)字化工作所需的嚴(yán)密的規(guī)范化管理體系。
2、首先考慮采用國際標(biāo)準(zhǔn),其次才是國家、行業(yè)及地方標(biāo)準(zhǔn)。由于檔案信息的范圍和種類處于不斷擴(kuò)展和變化之中,因此即使在檔案館數(shù)字化階段也應(yīng)優(yōu)先采用適用范圍盡可能廣泛的標(biāo)準(zhǔn),盡量做到一次到位。檔案館數(shù)字化建設(shè)中確定標(biāo)準(zhǔn)的原則是:面向計(jì)算機(jī)和網(wǎng)絡(luò)及信息平臺的處理,直接采用國際和國家標(biāo)準(zhǔn);面向綜合性信息的處理優(yōu)先采用國家標(biāo)準(zhǔn);面向檔案信息的處理以借鑒為主進(jìn)行補(bǔ)充,由此形成標(biāo)準(zhǔn)化的規(guī)范體系。
(二)建設(shè)高質(zhì)量的檔案信息數(shù)據(jù)庫。早在1992年就有學(xué)者指出檔案工作現(xiàn)代化的核心是建設(shè)高質(zhì)量的數(shù)據(jù)庫,這個(gè)認(rèn)識到今天仍然具有指導(dǎo)意義。現(xiàn)在我們檔案館數(shù)字化建設(shè)的核心依然是建設(shè)檔案信息數(shù)據(jù)庫,并通過網(wǎng)絡(luò)平臺進(jìn)行信息傳遞和信息交流。
檔案館計(jì)算機(jī)數(shù)據(jù)庫類型以檢索性數(shù)據(jù)庫和文件性數(shù)據(jù)庫兩種較為常見,檢索性數(shù)據(jù)庫主要用于揭示館藏內(nèi)容,介紹開放檔案的范圍、目錄和提供網(wǎng)上檢索途徑;文件性數(shù)據(jù)庫,主要用于完整地載入檔案文件,使人們可以通過網(wǎng)絡(luò)獲得檔案信息。檔案信息數(shù)字化后以數(shù)據(jù)形式集合成數(shù)據(jù)庫,檔案信息組織形式就發(fā)生了本質(zhì)上的變化,從原先紙張上順序的、線形的方式轉(zhuǎn)變?yōu)橛?jì)算機(jī)的直接的、網(wǎng)狀的方式,索引文件、超文本技術(shù)可以使信息按本身的邏輯關(guān)系組織成相互聯(lián)系的網(wǎng)狀結(jié)構(gòu),依賴先進(jìn)的智能化信息管理技術(shù),以人工語言或自然語言進(jìn)行搜索,為用戶提供方便、高效的服務(wù)。一個(gè)高質(zhì)量的數(shù)據(jù)庫中的數(shù)字信息要達(dá)到以下質(zhì)量標(biāo)準(zhǔn):第一、數(shù)據(jù)的準(zhǔn)確性;第二、數(shù)據(jù)項(xiàng)目和內(nèi)容的完整性;第三、數(shù)據(jù)的規(guī)范性;第四、數(shù)據(jù)的穩(wěn)定性。
(三)檔案信息安全問題。安全是檔案館數(shù)字化建設(shè)不可忽視的一個(gè)重要方面。檔案館與圖書館最根本的不同在于圖書信息基本上是面對普通公眾,而檔案信息則對安全保密有嚴(yán)格的要求,有相當(dāng)一部分檔案信息是需要控制使用的,所以檔案館數(shù)字化建設(shè)中必須采取一系列措施保證檔案信息的保密和安全。通常采取的措施可以分為制度管理和技術(shù)保證兩類,檔案館在數(shù)字化建設(shè)中對此應(yīng)該形成一套管理制度體系,此外還需要有相應(yīng)的技術(shù)措施進(jìn)行自動控制,才能做到更加嚴(yán)密。如中國第二歷史檔案館在進(jìn)行民國檔案數(shù)字化建設(shè)的探索時(shí)就十分重視數(shù)據(jù)的安全問題。他們認(rèn)為在黑客猖獗和網(wǎng)絡(luò)安全保護(hù)手段不健全的情況下,為了確保檔案信息的保密和安全,可以有計(jì)劃、有步驟、分階段地進(jìn)行數(shù)字化民國檔案網(wǎng)絡(luò)化服務(wù)。他們首先對已有的檔案信息系統(tǒng)進(jìn)行改進(jìn)分化,對館內(nèi)不同用戶根據(jù)權(quán)限提供全文檔案信息,使館藏信息首先在館內(nèi)達(dá)到資源共享。當(dāng)館內(nèi)數(shù)據(jù)庫接入Internet網(wǎng)時(shí),除盡最大可能保證網(wǎng)絡(luò)安全外,將那些有機(jī)密性的、不開放的檔案不存放在網(wǎng)絡(luò)服務(wù)器上。在當(dāng)前的技術(shù)條件下,為了解決檔案信息的安全問題,也可以使用Intranet技術(shù),提供授權(quán)的檔案信息服務(wù)。
(四)加快相關(guān)人才的培養(yǎng)和使用。人才問題是關(guān)系到檔案館數(shù)字化建設(shè)成敗的另一關(guān)鍵。檔案館數(shù)字化建設(shè)的過程是與新知識、新技術(shù)的普及密不可分的,所以各類相關(guān)人才的引進(jìn)和培養(yǎng)必須引起高度的重視。檔案館數(shù)字化建設(shè)過程中必須考慮培養(yǎng)的人員有以下幾類:系統(tǒng)開發(fā)與維護(hù)、數(shù)字化加工與管理、標(biāo)準(zhǔn)化建設(shè)、數(shù)據(jù)庫運(yùn)行管理等。
目前我國的檔案專業(yè)教育,無論是高等教育,還是各種專業(yè)知識培訓(xùn),都顯得知識陳舊,內(nèi)容更新慢,缺乏計(jì)算機(jī)技術(shù)與檔案及檔案工作關(guān)系的內(nèi)容,其結(jié)果也就使得檔案界嚴(yán)重缺乏既具有檔案專業(yè)知識又具有計(jì)算機(jī)等相關(guān)知識的復(fù)合性人才,阻礙了計(jì)算機(jī)等現(xiàn)代化技術(shù)在檔案事業(yè)上的運(yùn)用。對此,檔案教育界必須引起高度重視,奮起直追,加大培訓(xùn)力度。
同時(shí)檔案館也必須重視對在職人員的培訓(xùn)工作,重視引進(jìn)相關(guān)的專業(yè)人才,以適應(yīng)檔案館數(shù)字化建設(shè)的需要。在相關(guān)的崗位培訓(xùn)及人才引進(jìn)時(shí)應(yīng)該遵守以下原則:1、做到有提前量,使有關(guān)人員對新技術(shù)新設(shè)備提前了解。2、針對不同對象分層次培養(yǎng),要求知識技能與崗位相適應(yīng)。3、充分依靠社會支持,引進(jìn)人才但不浪費(fèi)人才,做到人員結(jié)構(gòu)合理。
以上是我們對檔案館數(shù)字化建設(shè)的一些淺見,F(xiàn)在各地檔案部門都很重視這方面的信息,有些單位已將此擺上了議事日程,但相對于圖書館部門,檔案部門的動作已經(jīng)滯后。中國數(shù)字圖書館工程現(xiàn)已進(jìn)入了實(shí)質(zhì)性操作階段,其在數(shù)字圖書館的總體結(jié)構(gòu)、標(biāo)準(zhǔn)規(guī)范、技術(shù)線路等方面已經(jīng)積累了相當(dāng)?shù)慕?jīng)驗(yàn)。1999年3月成立的“國家圖書館文獻(xiàn)數(shù)字化中心”年生產(chǎn)規(guī)模已經(jīng)達(dá)到5000萬至6000萬頁全文影像數(shù)據(jù),它的網(wǎng)絡(luò)可以提供1000G存儲量的網(wǎng)上信息服務(wù)。檔案館如果還不重視檔案館的數(shù)字化建設(shè),不能在網(wǎng)絡(luò)上有效地傳遞檔案信息,就無法融入信息時(shí)代的快車道,最終將被信息社會淘汰。因此,為適應(yīng)社會發(fā)展的需要,檔案館數(shù)字化建設(shè)不僅僅是一項(xiàng)具有前瞻性的舉措,它還具有更深刻的戰(zhàn)略意義。
擴(kuò)展閱讀:數(shù)字檔案館數(shù)字化加工中心建設(shè)方案(共享版)
檔案數(shù)字化加工中心
建設(shè)方案
檔案數(shù)字化加工中心建設(shè)
目錄
一、前言.......................................................................................................................2二、單位數(shù)字化建設(shè)現(xiàn)狀...........................................................................................2三、系統(tǒng)建設(shè)目標(biāo).......................................................................................................3四、系統(tǒng)總體構(gòu)架.......................................................................................................0五、系統(tǒng)建設(shè)方案.......................................................................................................0六、數(shù)字檔案系統(tǒng)關(guān)鍵技術(shù)解決方案.......................................................................4七、項(xiàng)目實(shí)施步驟.......................................................................................................5八、檔案數(shù)字化加工系統(tǒng)簡介.................................................錯(cuò)誤!未定義書簽。九、項(xiàng)目合作方式.....................................................................錯(cuò)誤!未定義書簽。
檔案數(shù)字化加工中心建設(shè)
一、前言
長久以來,我們一直在采用柜架式的資料存放目錄本式的查詢檢索方法管理我們的文檔資料。這無疑會占用大量的庫房空間,而在查閱檔案時(shí)又費(fèi)時(shí)費(fèi)力。即使現(xiàn)在有不少單位使用了計(jì)算機(jī)管理也多數(shù)目錄級電腦管理調(diào)檔,仍然要去庫房所以依然存在庫房壓力大、調(diào)卷不便、響應(yīng)速度慢、原件易損等問題。
很顯然在信息化社會的今天,隨著科學(xué)技術(shù)的不斷發(fā)展,特別是無紙化辦公、電子商務(wù)等應(yīng)用技術(shù)的不斷普及,社會發(fā)展和各級政府對檔案的數(shù)字化建設(shè)提出了迫切的需求。上述傳統(tǒng)的檔案管理方式,已經(jīng)無法滿足社會企事業(yè)單位內(nèi)各層次人員對文檔資料的查詢調(diào)閱再利用等方面的要求。
二、單位數(shù)字化建設(shè)現(xiàn)狀
為推動我省檔案事業(yè)持續(xù)健康發(fā)展,使檔案工作更好地為全面建設(shè)小康社會和海峽西岸經(jīng)濟(jì)區(qū)服務(wù),福建省特制定“十一五”(201*-201*年)全省檔案事業(yè)發(fā)展規(guī)劃。根據(jù)規(guī)劃要求,各級檔案館、事業(yè)單位要根據(jù)各自檔案應(yīng)用情況,加快檔案信息化建設(shè)、完善檔案基礎(chǔ)網(wǎng)絡(luò)建設(shè)、完成檔案信息應(yīng)用平臺建設(shè)、加快存量檔案數(shù)字化、努力實(shí)現(xiàn)增量檔案電子化、建立和健全檔案信息保障體系。
目前,各省市檔案館已根據(jù)規(guī)化完成對應(yīng)的數(shù)字檔案館建設(shè)。區(qū)市(縣)數(shù)字檔案館建設(shè),目前已經(jīng)提到了議事日程。福建省、福州市、泉州市等檔案館在數(shù)字化、信息化、網(wǎng)絡(luò)化建設(shè)方面取得了較大成效。其他各市區(qū)檔案館正在積極籌措,有的已經(jīng)取得了不少的進(jìn)展。
各事業(yè)單位也根據(jù)各自檔案特點(diǎn)、不斷加快數(shù)字化建設(shè)、提高檔案數(shù)字化利用水平。如國土、房地產(chǎn)、稅務(wù)、電信、證券、電力等系統(tǒng)根據(jù)各自事業(yè)單位特點(diǎn)完成綜合數(shù)字化資源管理平臺建設(shè)、同時(shí)完成歷年存量檔案的數(shù)字化建設(shè)。為檔案信息資源的綜合應(yīng)用提供高效的信息平臺。
目前,各事業(yè)單位數(shù)字化加工中心建設(shè),具備了環(huán)境、基礎(chǔ)、技術(shù)和財(cái)力的可行性。它必將推動整個(gè)福建檔案信息化建設(shè)向更高水平邁進(jìn),實(shí)現(xiàn)檔案信息資源充分共享,為海峽西岸經(jīng)濟(jì)區(qū)建設(shè)提供優(yōu)質(zhì)、高效的信息服務(wù)。
檔案數(shù)字化加工中心建設(shè)
三、系統(tǒng)建設(shè)目標(biāo)
根據(jù)數(shù)字化建設(shè)理論和方法,按照福州市數(shù)字檔案館建設(shè)模式開展,即構(gòu)建四個(gè)基礎(chǔ)設(shè)施平臺,建設(shè)兩個(gè)大型數(shù)據(jù)庫,開發(fā)一個(gè)綜合數(shù)字化資源管理系統(tǒng),制訂一系列操作標(biāo)準(zhǔn)、規(guī)程,培養(yǎng)一支檔案信息化建設(shè)隊(duì)伍。形成一個(gè)集成數(shù)據(jù)采集、數(shù)據(jù)存儲、數(shù)據(jù)應(yīng)用和數(shù)據(jù)管理為核心的數(shù)字化加工中心。
檔案館數(shù)字化檔案建設(shè)的是以紙質(zhì)文檔數(shù)字化建設(shè)為核心的檔案數(shù)字化加工中心,其基本原理通過各種高速掃描設(shè)備(高速掃描儀、工程圖紙掃描儀、平板掃描儀、數(shù)碼相機(jī))采集影像信息,通過數(shù)字化加工系統(tǒng)的圖象處理、文件排序、質(zhì)量審查、質(zhì)量二次檢查、數(shù)據(jù)掛接等一系列流水化作業(yè),把紙制文檔轉(zhuǎn)化為可供數(shù)據(jù)檢索的全文信息影像,實(shí)現(xiàn)數(shù)據(jù)的共享和利用。
四、系統(tǒng)總體構(gòu)架
歸檔備份流程無紙化應(yīng)用影像數(shù)據(jù)接口內(nèi)部檢索應(yīng)用對外檢索服務(wù)政務(wù)信息公開檔案編研資源共享平臺打印輸出統(tǒng)計(jì)分析數(shù)據(jù)挖掘其他應(yīng)用…五、系統(tǒng)建設(shè)方案
(一)基礎(chǔ)設(shè)施建設(shè)
1、數(shù)字檔案信息傳輸平臺建設(shè)
網(wǎng)絡(luò)傳輸平臺主要由局域網(wǎng)絡(luò)(內(nèi)網(wǎng))和Internet互聯(lián)網(wǎng)(外網(wǎng))絡(luò)兩個(gè)個(gè)平臺組成。①局域網(wǎng)絡(luò)平臺,承擔(dān)數(shù)字檔案館內(nèi)部數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)利用等主要業(yè)務(wù)工作。所有保密信息只能在局域網(wǎng)絡(luò)處理,嚴(yán)格控制使用人員,確保檔案信息安全。
②國際互聯(lián)網(wǎng)絡(luò)平臺,數(shù)字檔案館連接Internet國際互聯(lián)網(wǎng)的外部網(wǎng)絡(luò)平臺,承擔(dān)檔案信息發(fā)布、檔案信息在線利用等工作。
目前,絕大多數(shù)的事業(yè)單位均已完成這一部分的基礎(chǔ)平臺建設(shè),只要進(jìn)行部分調(diào)整即可滿足數(shù)字化加工中心網(wǎng)絡(luò)建設(shè)的需求。
2、數(shù)字檔案信息采集平臺建設(shè)
采集平臺主要建設(shè)電子目錄采集平臺,全文數(shù)據(jù)采集平臺等,承擔(dān)數(shù)字檔案信息的日常采集工作。
①目錄采集平臺主要承擔(dān)館藏各種檔案資料目錄數(shù)據(jù)信息的采集工作。
實(shí)現(xiàn)每人1臺計(jì)算機(jī)聯(lián)網(wǎng)工作(局域網(wǎng)絡(luò)),按照分工開展目錄數(shù)據(jù)接收、錄入、檢查等工作。
②全文數(shù)據(jù)采集平臺主要包括館藏紙質(zhì)檔案采集(掃描)、新增電子檔案數(shù)據(jù)采集(接收)、照片檔案采集(掃描或接收)、多媒體檔案采集(接收、制作)、資料信息采集(接收)等平臺。
一般可以配備高速掃描儀1臺,普通掃描儀1臺以上,建立適合的數(shù)字化加工中心;掃描設(shè)備的性能和數(shù)量配置可根據(jù)各事業(yè)單位館藏歷史數(shù)量和數(shù)字化建設(shè)進(jìn)度進(jìn)行合理配置。根據(jù)需要配備音視頻信息系統(tǒng),開展多媒體信息的采集、編輯、制作。
3、數(shù)字檔案信息存儲管理平臺建設(shè)
數(shù)字化加工中心存儲管理平臺主要包括館內(nèi)數(shù)據(jù)存儲管理服務(wù)器2臺,NAS結(jié)構(gòu)全文存儲管理服務(wù)器1臺,數(shù)據(jù)庫實(shí)時(shí)備份系統(tǒng)1套,光盤刻錄機(jī)1部,斷電保護(hù)UPS系統(tǒng)1套,SQLSERVER數(shù)據(jù)庫系統(tǒng)1套,Windows201*AdvanceServer服務(wù)器操作系統(tǒng)1套,承擔(dān)數(shù)字檔案信息的存儲管理和信息發(fā)布工作,目前多數(shù)檔案館多已使用的檔案館提供的館藏資源數(shù)字化管理系統(tǒng),其服務(wù)器,數(shù)據(jù)庫多已在使用,需要補(bǔ)充的是數(shù)據(jù)庫實(shí)時(shí)備份系統(tǒng),以保證數(shù)據(jù)信息的安全存儲。
4、數(shù)字檔案信息應(yīng)用平臺建設(shè)
數(shù)字化應(yīng)用平臺建設(shè),基本實(shí)現(xiàn)每人1臺計(jì)算機(jī),安裝“綜合檔案館數(shù)字信息管理檔案數(shù)字化加工中心建設(shè)
平臺”,通過網(wǎng)絡(luò)連接服務(wù)器,實(shí)現(xiàn)數(shù)字檔案信息的查閱利用、編輯研究、數(shù)據(jù)輸出等綜合應(yīng)用功能。
互聯(lián)網(wǎng)檔案信息發(fā)布和在線利用平臺建設(shè),即網(wǎng)站建設(shè)。事業(yè)單位網(wǎng)站建設(shè)可以充分利用區(qū)市政府計(jì)算機(jī)中心的網(wǎng)絡(luò)資源,將檔案主頁掛接在計(jì)算機(jī)中心的服務(wù)器上;也可以租用服務(wù)器資源或自己購買服務(wù)器,利用自己的網(wǎng)絡(luò)出口,服務(wù)器放在本單位或?qū)嵭蟹⻊?wù)器托管。
政府網(wǎng)絡(luò)信息服務(wù)平臺建設(shè),利用1臺服務(wù)器和1臺全文存儲服務(wù)器,連接政府網(wǎng)絡(luò)來實(shí)現(xiàn)。主要用于接收電子政務(wù)產(chǎn)生的電子公文數(shù)據(jù),接收通過機(jī)關(guān)檔案管理系統(tǒng)整理完畢的電子檔案數(shù)據(jù),瀏覽下載各種有價(jià)值的數(shù)據(jù)信息,開展檔案信息發(fā)布,檔案信息在線利用工作,可以實(shí)現(xiàn)網(wǎng)上文檔服務(wù)功能(代替實(shí)體文檔服務(wù)中心),保密信息不在網(wǎng)上傳輸。
(二)檔案信息數(shù)據(jù)庫建設(shè)
數(shù)字化服務(wù)中心規(guī)劃構(gòu)建兩個(gè)大型信息數(shù)據(jù)庫:檔案目錄數(shù)據(jù)庫,全文影像數(shù)據(jù)庫,這二個(gè)數(shù)據(jù)庫集中存儲了數(shù)字檔案館的所有數(shù)據(jù)信息?紤]到大容量的數(shù)據(jù)存儲和管理是整個(gè)數(shù)字檔案館的基礎(chǔ),因此,針對檔案館數(shù)據(jù)的特征,我們分別采用大型的關(guān)系數(shù)據(jù)庫來保存管理其業(yè)務(wù)及條目數(shù)據(jù),如檔案目錄,以達(dá)到易管理、易檢索利用的要求;用非結(jié)構(gòu)化的文件方式存儲其全文數(shù)據(jù),如照片、多媒體,可以達(dá)到大容量(1TB)、不依賴于現(xiàn)有平臺和系統(tǒng)、易擴(kuò)展的要求。詳見數(shù)據(jù)庫建設(shè)一覽表
1、檔案目錄數(shù)據(jù)庫:該數(shù)據(jù)庫主要存儲著錄標(biāo)引產(chǎn)生的以二維數(shù)據(jù)表方式存放的檔案二次文獻(xiàn),主要包括檔案資料案卷級、文件級目錄,人名索引。數(shù)字檔案館目錄數(shù)據(jù)庫主要數(shù)據(jù)來源包括館藏檔案資料目錄數(shù)據(jù),以及應(yīng)用過程目錄數(shù)據(jù)。
2、全文數(shù)據(jù)庫:檔案全文數(shù)據(jù)庫包括紙質(zhì)檔案資料數(shù)字化形成的圖像數(shù)據(jù),照片檔案數(shù)字化形成的圖像數(shù)據(jù),館藏錄音帶、錄像帶數(shù)字化后形成的多媒體信息,其他新增的電子檔案數(shù)據(jù),重要資料信息數(shù)據(jù)。
目前,事業(yè)單位的檔案情況主要有兩種形式,一種為存量檔案,即多年來積累形成一系列需要長期保存的檔案資料。這部門檔案的主要特點(diǎn)是檔案數(shù)量較多。完成存量檔案的全文數(shù)據(jù)庫建設(shè)需要建立完整的數(shù)字化加工中心,通過流水線作業(yè),完成數(shù)據(jù)錄入、影像掃描、圖像處理、數(shù)據(jù)歸檔、審核等一列列工作。
另一種為每天新增檔案資料,它的是數(shù)量較少、每天的產(chǎn)量不定。這部分可通過數(shù)據(jù)采集系統(tǒng),在接收過程中逐步實(shí)現(xiàn)數(shù)據(jù)錄入、掃描、歸檔、應(yīng)用等一系列工作。同時(shí)完成全文影像庫建設(shè)。
檔案數(shù)字化加工中心建設(shè)
(三)數(shù)字檔案信息綜合管理系統(tǒng)
根據(jù)事業(yè)單位的規(guī)模、人員以及所承擔(dān)的業(yè)務(wù),其數(shù)字檔案館管理系統(tǒng)主要應(yīng)包括以下幾個(gè)方面的內(nèi)容:
1、
文檔數(shù)字化加工系統(tǒng)。
該系統(tǒng)通過集成高速掃描儀、大幅面圖紙掃描儀、平板掃描儀等采集設(shè)備采集紙制文檔資料。經(jīng)過流水線數(shù)字化處理,實(shí)現(xiàn)紙制文檔到數(shù)字化電子文檔的轉(zhuǎn)換。
系統(tǒng)包括檔案出入庫登記、數(shù)據(jù)雙機(jī)錄入、文件掃描、影像處理、一次質(zhì)檢、二次審核,實(shí)現(xiàn)文檔數(shù)字化流水線作業(yè)。完成檔案數(shù)字化加工所涉及的全部工作流程。同時(shí)具有流水線定制、任務(wù)分配、工作量統(tǒng)計(jì)、工資統(tǒng)計(jì)等功能。能滿足大批量歷史檔案的集中掃描工作。
數(shù)字化作業(yè)流程圖
2、綜合檔案館數(shù)字信息管理平臺。
該平臺按照文檔一體化、館室一體化建設(shè)的考慮,應(yīng)對事業(yè)單位檔案進(jìn)行前瞻性控制,按照電子文件與紙質(zhì)文件“四同步”的管理模式,實(shí)現(xiàn)標(biāo)準(zhǔn)統(tǒng)一,數(shù)據(jù)共享。平臺
檔案數(shù)字化加工中心建設(shè)
主要包括電子檔案以及新增檔案接收、錄入、掃描、處理、歸檔、流程應(yīng)用,檔案資料編目、在線檢索利用、庫房動態(tài)管理、檔案資料征集、檔案信息編研、數(shù)據(jù)報(bào)表打印、系統(tǒng)維護(hù)等功能。同時(shí)可根據(jù)不同單位檔案特點(diǎn)以及應(yīng)用實(shí)現(xiàn)系統(tǒng)定制。
3、檔案信息發(fā)布系統(tǒng)(網(wǎng)站)。
在各單位已開發(fā)建立的網(wǎng)站和網(wǎng)頁中,增加含有目錄查閱、文檔服務(wù)、在線利用等基本功能,具有很強(qiáng)可維護(hù)性的數(shù)字檔案的信息發(fā)布系統(tǒng)。(四)數(shù)字檔案館理論、標(biāo)準(zhǔn)及操作規(guī)程建設(shè)
標(biāo)準(zhǔn)化、規(guī)范化是數(shù)字檔案館建設(shè)的重要前提和基礎(chǔ)。數(shù)字檔案館有關(guān)理論、標(biāo)準(zhǔn)、規(guī)程,可以參照福建省數(shù)字檔案館制訂的標(biāo)準(zhǔn)開展,不足部分相應(yīng)添加,主要包括以下內(nèi)容:
電子檔案管理技術(shù)標(biāo)準(zhǔn)電子文件歸檔與管理規(guī)范文書檔案目錄數(shù)據(jù)庫交換標(biāo)準(zhǔn)檔案文件開放控制辦法檔案資料數(shù)字化標(biāo)準(zhǔn)光盤載體檔案封面標(biāo)注格式紙質(zhì)檔案數(shù)字化操作規(guī)程照片檔案數(shù)字化操作規(guī)程縮微檔案數(shù)字化操作規(guī)程館藏檔案資料數(shù)字化范圍數(shù)字化加工項(xiàng)目質(zhì)量保證體系數(shù)字化加工安全保密措施(五)數(shù)據(jù)安全建設(shè)
數(shù)據(jù)安全建設(shè)主要保證過程數(shù)據(jù)和最終成果數(shù)據(jù)的安全。主要是保證檔案目錄數(shù)據(jù)庫和全文數(shù)據(jù)庫的安全。
目錄數(shù)據(jù)庫以二維數(shù)據(jù)表方式存放在數(shù)據(jù)庫中,數(shù)據(jù)在增加、修改、刪除以及誤操作、系統(tǒng)崩潰、病毒侵害、文件損壞等情況均可能導(dǎo)致系統(tǒng)數(shù)據(jù)庫損害,因此對于數(shù)據(jù)庫的安全,我們建議采用可實(shí)時(shí)備份、實(shí)時(shí)回退、即時(shí)托管的數(shù)據(jù)庫保鏢,保證任何時(shí)候在數(shù)據(jù)受到損害時(shí)可以及時(shí)回退恢復(fù),同時(shí)在系統(tǒng)崩潰或服務(wù)器異常時(shí)可以及時(shí)托管,保證業(yè)務(wù)的正常運(yùn)行。
全文數(shù)據(jù)庫安全,全文數(shù)據(jù)庫主要存儲系統(tǒng)的電子影像、電子文件數(shù)據(jù)。這些包含
檔案數(shù)字化加工中心建設(shè)
增量數(shù)據(jù)和存量數(shù)據(jù)的影像文件。為了保證這些數(shù)據(jù)的安全需要雙備份。建議采用PlasmonUDO光盤庫進(jìn)行永久性數(shù)據(jù)備份。其具有永久性(50年)、不可更改、高可靠性、以及總體成本低的特點(diǎn)?梢愿鶕(jù)數(shù)據(jù)增長情況,選用相應(yīng)的型號的設(shè)備。(六)人才隊(duì)伍建設(shè)
數(shù)字檔案館要求館內(nèi)業(yè)務(wù)人員不僅掌握傳統(tǒng)檔案管理的技術(shù)、技能,還要具備現(xiàn)代化、數(shù)字化、網(wǎng)絡(luò)化管理的基本技能,擁有較高水平的信息化管理人才。至少應(yīng)配備2名計(jì)算機(jī)專業(yè)人才,負(fù)責(zé)網(wǎng)絡(luò)和應(yīng)用系統(tǒng)管理維護(hù),具體掌握網(wǎng)絡(luò)技術(shù)、網(wǎng)站建設(shè)維護(hù)技術(shù)、數(shù)據(jù)庫應(yīng)用技術(shù)、檔案資料數(shù)字化技術(shù)、多媒體采編技術(shù)等等;其它工作人員應(yīng)能夠獨(dú)立操作計(jì)算機(jī),掌握網(wǎng)絡(luò)應(yīng)用技能,檔案管理系統(tǒng)操作技能等。
同時(shí)。為了保證數(shù)字化建設(shè)質(zhì)量,需要指定專人負(fù)責(zé)數(shù)字化建設(shè)質(zhì)量的管理、考核、監(jiān)督,保證數(shù)字化建設(shè)最終質(zhì)量。
六、數(shù)字檔案系統(tǒng)關(guān)鍵技術(shù)解決方案
1、數(shù)據(jù)庫選擇
目錄數(shù)據(jù)是數(shù)字檔案系統(tǒng)館主要的、需要反復(fù)查詢的數(shù)據(jù),選擇何種數(shù)據(jù)庫系統(tǒng)管理目錄數(shù)據(jù),是我們首先應(yīng)提出的主要問題。本著節(jié)約、實(shí)用、通用的原則,建議選用SQLSERVER201*(50用戶以上)數(shù)據(jù)庫管理系統(tǒng)。主要原因是微軟公司是世界上最大軟件公司,其數(shù)據(jù)庫產(chǎn)品具有穩(wěn)定性好、安全性強(qiáng)、查詢速度快、投入較低的特點(diǎn),非常適合作為檔案行業(yè)的主數(shù)據(jù)庫系統(tǒng)。2、服務(wù)器選擇
服務(wù)器是數(shù)字檔案館的關(guān)鍵設(shè)備,是各個(gè)平臺建設(shè)的基礎(chǔ),關(guān)系到數(shù)據(jù)安全、檢索利用速度等多個(gè)環(huán)節(jié),要求連續(xù)不停機(jī)運(yùn)行。按照數(shù)字檔案系統(tǒng)規(guī)劃,至少應(yīng)購置2臺較高性能的企業(yè)級服務(wù)器,一臺用于館內(nèi)局域網(wǎng)絡(luò)系統(tǒng),支撐檔案信息管理服務(wù);一個(gè)用于支撐數(shù)字化加工系統(tǒng)的數(shù)據(jù)服務(wù),保證流水線作業(yè)的穩(wěn)定運(yùn)行。3、全文數(shù)據(jù)信息存儲服務(wù)器選擇
數(shù)字檔案系統(tǒng)所有數(shù)據(jù)主要包括以二維數(shù)據(jù)表方式存儲的目錄數(shù)據(jù)、各種檔案全文數(shù)據(jù)(圖像、文本等)和多媒體數(shù)據(jù)。全文數(shù)據(jù)是數(shù)字檔案館的基礎(chǔ)數(shù)據(jù),數(shù)據(jù)量龐大,要求存儲性能安全、可靠,具有擴(kuò)展功能。我們建議采用光盤鏡像服務(wù)器解決,該服務(wù)器采用NAS結(jié)構(gòu),直接連接在網(wǎng)絡(luò)交換機(jī)上,且可以擴(kuò)展以滿足系統(tǒng)今后海量信息存儲的需要,多媒體數(shù)據(jù)則全部以MPEG2文件方式一式兩套保存在光盤上。
檔案數(shù)字化加工中心建設(shè)
對于需要進(jìn)行永久數(shù)據(jù)備份的用戶。則采用PlasmonUDO光盤庫進(jìn)行永久性數(shù)據(jù)備份。
4、掃描設(shè)備選擇
掃描儀主要負(fù)責(zé)文檔采集端的文件掃描工作。適合性能的掃描設(shè)備是保證整個(gè)數(shù)字化常量的關(guān)鍵一環(huán)。其主要性能包括最大掃描幅面(A4/A3)、掃描速度(保證日常量)、可靠性(滿足長時(shí)間運(yùn)行需要)、進(jìn)紙能力、售前、售后支持等。這些性能的選擇主要根據(jù)用戶的檔案紙質(zhì)情況、資金預(yù)算情況、項(xiàng)目數(shù)字化進(jìn)度等因素進(jìn)行綜合考慮。5、文檔在線利用
數(shù)字檔案館與傳統(tǒng)檔案館最根本的區(qū)別之一就是要實(shí)現(xiàn)檔案的在線利用,即通過網(wǎng)絡(luò)實(shí)現(xiàn)檔案的檢索利用?紤]到區(qū)市檔案館的實(shí)際情況以及文檔服務(wù)的特點(diǎn),我們在此提出文檔在線利用問題。文檔在線利用主要借助數(shù)字檔案館的信息網(wǎng)站,將可以開放的文件、檔案(目錄和原件),在政府網(wǎng)絡(luò)或internet上提供利用,實(shí)現(xiàn)文檔服務(wù)中心的功能。
七、項(xiàng)目實(shí)施步驟
目前,各部門還沒有形成一個(gè)完善的數(shù)字化建設(shè)標(biāo)準(zhǔn),即使已明確提出建設(shè)數(shù)字檔案系統(tǒng)的單位,其在投資規(guī)模、建設(shè)模式、建設(shè)手段等相差也比較大,有的投資數(shù)千萬元,有的投資幾百萬元。實(shí)際上,作為數(shù)字檔案系統(tǒng)建設(shè),不可能千篇一律,只要具備數(shù)字檔案系統(tǒng)的基本功能,即能夠?qū)崿F(xiàn)各種類型信息的采集功能,以形成豐富的綜合信息資源數(shù)據(jù)庫;具備海量數(shù)據(jù)存儲功能,滿足數(shù)字檔案信息安全存儲要求;具備檔案信息的有效訪問和查詢功能,滿足不同用戶的不同需求;具備檔案信息的發(fā)布與傳遞功能,能夠?qū)崿F(xiàn)信息的在線檢索利用;具備數(shù)字檔案信息的系統(tǒng)管理功能,滿足檔案業(yè)務(wù)工作的基本需求,就可以認(rèn)為其已經(jīng)基本建成了數(shù)字檔案系統(tǒng)平臺建設(shè)。
用戶可根據(jù)自己的檔案情況、檔案數(shù)量、利用情況、以及檔案重要性程度建立適合的綜合檔案數(shù)字化加工中心。完成檔案數(shù)字化建設(shè)。其具體實(shí)施總體步驟如下:
數(shù)字化建設(shè)需求分析確定數(shù)字化建設(shè)方案軟硬件設(shè)備選購、人員配置建設(shè)數(shù)字化建設(shè)標(biāo)準(zhǔn)和規(guī)范建立數(shù)字化加工中心
檔案數(shù)字化加工中心建設(shè)
建立數(shù)字化加工制度人員培訓(xùn)和試運(yùn)行項(xiàng)目穩(wěn)定運(yùn)行項(xiàng)目驗(yàn)收項(xiàng)目總結(jié)
下面,以具體單位內(nèi)部檔案室建立紙制檔案數(shù)字化加工中心為例,按照數(shù)字化加工中心建立步驟具體講解實(shí)施方案:(一)數(shù)字化建設(shè)需求分析
首先是數(shù)字化建立的需求分析,了解自己的檔案情況,詳細(xì)內(nèi)容包括:
需掃描的檔案類型,是哪一類型檔案,如婚姻檔案、土地檔案、房產(chǎn)檔案、工程檔案、科技檔案、會計(jì)檔案等每種檔案都有各自不同的特點(diǎn)。
文檔的特點(diǎn):紙質(zhì)、厚薄、大小尺寸,這些決定了使用什么樣的采集設(shè)備,如:紙制幅面為A4的只要使用A4幅面的掃描儀,如果有A3幅面的檔案就需要配備A3幅面的掃描儀,如果有大于A3的文件如工程圖紙、大的地契、地震圖等就需要配備工程圖紙掃描儀,如果還有更大幅面的就可能需要采用配置較好的數(shù)碼相機(jī)。
檔案紙制的好差關(guān)系到使用什么樣的設(shè)備,如果紙制較好就可以選用高速掃描儀進(jìn)行批量掃描。如果較差可能只用使用單張掃描。
檔案室的檔案量大約有多少,本期需要數(shù)字化檔案是多少,按正常每天5000張的數(shù)字化建設(shè)速度需要多長時(shí)間?
新增檔案的數(shù)量多少,是每天都在產(chǎn)生,還是每個(gè)月或是每年產(chǎn)生,產(chǎn)生的這些檔案是要即時(shí)數(shù)字化還是可以延后處理。
如果有下級單位,這些單位的檔案是集中進(jìn)行數(shù)字化建設(shè)還分布到各個(gè)點(diǎn)進(jìn)行數(shù)字化建設(shè),集中建設(shè)有助于檔案的集中和人員的統(tǒng)籌安排。
單位現(xiàn)有軟硬件情況,設(shè)備情況(掃描設(shè)備、電腦、存儲設(shè)備)、網(wǎng)絡(luò)環(huán)境、人員情況(項(xiàng)目負(fù)責(zé)人、檔案管理人員、技術(shù)人員、檔案數(shù)字化服務(wù)人員(整理、錄入、掃描、質(zhì)檢、審核))、現(xiàn)有軟件平臺:檔案系統(tǒng)、OA系統(tǒng)、業(yè)務(wù)系統(tǒng)、
檔案查詢利用情況,數(shù)字化成果需要馬上查詢利用,還是可以等全部驗(yàn)收合格后在利用。
數(shù)字化建設(shè)的長期規(guī)劃,完成指定檔案量數(shù)字化建設(shè)的工期,對于檔案數(shù)字化巨大的單位,可以根據(jù)實(shí)際情況合理安排數(shù)字化建設(shè)工期,可以一次性集中完成,也可根據(jù)時(shí)間分期進(jìn)行。
檔案數(shù)字化加工中心建設(shè)
(二)確定數(shù)字化建設(shè)方案
隨著國家信息化建設(shè)的進(jìn)程,政務(wù)信息公開的需求,各政府企事業(yè)都已經(jīng)把檔案數(shù)字化工作提上工作日程,多數(shù)都已正在進(jìn)行或已完成檔案數(shù)字化建設(shè)任務(wù)。目前,數(shù)字化工作的主要方式有兩種:
1、單位內(nèi)部獨(dú)立進(jìn)行數(shù)字化工作。采購設(shè)備、安排人員進(jìn)行檔案數(shù)字化工作。2、采用服務(wù)外包的方式。
把檔案掃描任務(wù)整體外包為專業(yè)的檔案數(shù)字化加工企業(yè),在規(guī)定時(shí)間內(nèi)保質(zhì)保量完成數(shù)字化任務(wù),單位只負(fù)責(zé)檔案的數(shù)據(jù)的最終驗(yàn)收和監(jiān)督工作。
這兩種方式的區(qū)別如下:
采用單位內(nèi)部獨(dú)立進(jìn)行數(shù)字化工作,主要特點(diǎn)是需要投入大量的硬件設(shè)備,如高速掃描儀、若干電腦設(shè)備、相關(guān)網(wǎng)絡(luò)設(shè)備等,其中掃描設(shè)備多比較昂貴,其次,單位內(nèi)部熟悉數(shù)字化加工的專業(yè)技術(shù)服務(wù)人員不足。檔案數(shù)字化建設(shè)需要既熟悉檔案管理業(yè)務(wù),又精通計(jì)算機(jī)軟硬件、網(wǎng)絡(luò)、安全防范等技術(shù);技術(shù)人員既能參與數(shù)字化建設(shè)全過程,把握關(guān)鍵技術(shù)問題,又能在正常運(yùn)行后,了解和把握運(yùn)行過程中可能出現(xiàn)的各種技術(shù)問題,這方面的人才還比較缺乏。同時(shí)內(nèi)部安排人員還會占用內(nèi)部人員編制。
但優(yōu)點(diǎn)也很明顯,建立成功的數(shù)字化加工中心可以長期不間斷的完成檔案數(shù)字化建設(shè),提高自身的數(shù)字化加工能力,同時(shí)還能鍛煉培養(yǎng)自己的檔案技術(shù)服務(wù)人員。但前提是前期需要很長時(shí)間的摸索和實(shí)驗(yàn),不斷的進(jìn)步和積累。(三)軟硬件設(shè)備選購、人員配置
根據(jù)前期的需求分析,檔案情況,以及每天完成的檔案量采購適合的掃描設(shè)備、檔案數(shù)字化加工系統(tǒng)(掃描、處理、質(zhì)檢、排序、審核、掛接、統(tǒng)計(jì)、人員安排、工資統(tǒng)計(jì)、權(quán)限管理、數(shù)據(jù)備份等),并進(jìn)行前期的人員配置,安排基本的一條流水線配置,一般需要一臺高速掃描儀、一個(gè)掃描人員、兩個(gè)質(zhì)檢人員、一個(gè)總質(zhì)檢人員、一個(gè)檔案拆裝人員,五臺電腦、一臺服務(wù)器。(四)建設(shè)數(shù)字化建設(shè)標(biāo)準(zhǔn)和規(guī)范
數(shù)字化建設(shè)前期的紙制檔案數(shù)字化建設(shè)標(biāo)準(zhǔn)規(guī)范建設(shè)非常的重要,它是整個(gè)數(shù)字化建設(shè)工作的前提。它的主要指標(biāo)內(nèi)容包括:
數(shù)據(jù)錄入標(biāo)準(zhǔn)檔案整理標(biāo)準(zhǔn)
檔案掃描技術(shù)標(biāo)準(zhǔn)(掃描格式(TIF、JPG、PDF)、掃描模式(黑白、灰度、彩色)、
檔案數(shù)字化加工中心建設(shè)
掃描分辨率(200DPI、300DPI)、影像清晰度、影像處理標(biāo)準(zhǔn)(裁減、糾偏、去污、去邊等)、數(shù)據(jù)歸檔標(biāo)準(zhǔn)、數(shù)據(jù)掛接標(biāo)準(zhǔn)、數(shù)據(jù)審核標(biāo)準(zhǔn)等)
檔案存儲標(biāo)準(zhǔn)(檔案大小、存儲格式、保存方式、壓縮方式等)(五)建立數(shù)字化加工中心
根據(jù)每天需要完成的檔案情況配置生產(chǎn)流水線,建立紙制檔案數(shù)字化加工中心。其總體流程包括生產(chǎn)線配置、設(shè)備安裝、加工環(huán)境安裝、加工軟件安裝、場地布置、作業(yè)區(qū)分配等,其作業(yè)流程圖如下:
以一條流水線,每天完成5000張檔案進(jìn)行配置,數(shù)字化的加工設(shè)備及人員配備情況如下表,常量翻倍,人員及設(shè)備在此基礎(chǔ)上遞增。
項(xiàng)目設(shè)備硬件配置數(shù)字化加工中心人員及設(shè)備配置詳細(xì)設(shè)備1、高速掃描儀2、平板掃描儀3、PC機(jī)數(shù)量1臺1臺5臺備注完成紙制情況較好的資料完成紙制情況較差的幅面資料完成掃描、處理、質(zhì)檢、審核等工作檔案數(shù)字化加工中心建設(shè)4、服務(wù)器5、交換機(jī)1臺1臺工作服務(wù)器8個(gè)接口完成檔案接收、檔案雙機(jī)錄入、檔案掃描、圖象處理、檔案質(zhì)量審查、檔案排序、檔案質(zhì)量二次審核、檔案抽檢、檔案掛接、工資統(tǒng)計(jì)、數(shù)據(jù)統(tǒng)計(jì)等一系列操作完成圖紙、大圖等掃描、處理工作完成檔案拆分和裝訂工作完成數(shù)據(jù)雙機(jī)錄入工作完成高速掃描工作完成補(bǔ)掃等操作完成圖紙掃描工作完成圖象處理、檔案掃描質(zhì)量審核、頁面排序、補(bǔ)掃處理工作對質(zhì)檢質(zhì)量的二次審核工作。負(fù)責(zé)檔案交接、中心日常管理、異常處理、質(zhì)量考核、抽檢等工作負(fù)責(zé)中心掃描儀、軟件、電腦等維護(hù)和保養(yǎng)工作其中工作人員錄入組人員3名。掃描加工組人員:6名管理及技術(shù)服務(wù)人員2名軟件配置6、檔案裝訂、籃子、辦公用紙等。7、網(wǎng)線、電源設(shè)備。8、其他設(shè)備。1、檔案數(shù)字化加工系1套統(tǒng)2、影像采集軟件一套3、各種圖象處理軟件4、數(shù)據(jù)庫軟件人員配置1、檔案整理人員2、數(shù)據(jù)錄入人員1名3名3、高速掃描人員1名4、平板掃描人員1名5、圖紙掃描人員名6、質(zhì)檢人員2名7、總質(zhì)檢人員1名8、管理(交接)人員1名9、技術(shù)服務(wù)人員1名合計(jì):11名(六)建立數(shù)字化加工制度和操作規(guī)范在軟硬件配置完畢后,需要建立有效的加工制度,保證整體項(xiàng)目的順利實(shí)施。其中主要制度包括
1、加工中心崗位責(zé)任制度(管理人員、檔案技術(shù)服務(wù)人員、設(shè)備維護(hù)人員)
2、數(shù)字化加工保密制度3、檔案交接制度4、檔案整理操作規(guī)范5、檔案錄入操作規(guī)范6、檔案掃描操作規(guī)范
檔案數(shù)字化加工中心建設(shè)
7、檔案數(shù)字化加工崗位操作細(xì)則8、檔案數(shù)字化質(zhì)量保證(獎(jiǎng)懲)制度
(七)人員培訓(xùn)和試運(yùn)行
對相關(guān)人員(管理人員、檔案技術(shù)服務(wù)人員、設(shè)備維護(hù)人員)進(jìn)行相應(yīng)崗位的責(zé)任制度人員、加工中心制度培訓(xùn)、檔案數(shù)字化標(biāo)準(zhǔn)培訓(xùn)、檔案數(shù)字化加工崗位操作細(xì)則培訓(xùn)、掃描儀使用培訓(xùn)、掃描設(shè)備維護(hù)培訓(xùn)、檔案數(shù)字化加工軟件使用培訓(xùn)。
調(diào)用少量檔案進(jìn)行流水化作業(yè)實(shí)際操作培訓(xùn),針對操作中常見錯(cuò)誤錯(cuò)誤培訓(xùn),并實(shí)際操作,結(jié)合在操作中遇到的問題進(jìn)行現(xiàn)場培訓(xùn)。(八)項(xiàng)目穩(wěn)定運(yùn)行
采用流水線作業(yè),調(diào)用每天需要完成的檔案進(jìn)行檔案數(shù)字化作業(yè),并結(jié)合實(shí)際操作,完善操作細(xì)則,并安排足量的人員進(jìn)行項(xiàng)目的穩(wěn)定運(yùn)行。運(yùn)行中需要不斷監(jiān)控?cái)?shù)字化作業(yè)質(zhì)量、人員積極性、設(shè)備穩(wěn)定性。保證作業(yè)的順利運(yùn)行。(九)項(xiàng)目驗(yàn)收
根據(jù)檔案技術(shù)標(biāo)準(zhǔn)進(jìn)行數(shù)據(jù)驗(yàn)收,可根據(jù)項(xiàng)目進(jìn)度進(jìn)行階段性驗(yàn)收,在驗(yàn)收中總結(jié)改進(jìn)操作規(guī)范。直至完成整個(gè)項(xiàng)目的驗(yàn)收。(十)項(xiàng)目總結(jié)
對完成的項(xiàng)目進(jìn)行項(xiàng)目總結(jié),統(tǒng)計(jì)數(shù)據(jù)、分析常量、效率、質(zhì)量,并總結(jié)經(jīng)驗(yàn)、改進(jìn)流程和推廣。
友情提示:本文中關(guān)于《檔案館數(shù)字化、數(shù)字化檔案館、數(shù)字檔案館》給出的范例僅供您參考拓展思維使用,檔案館數(shù)字化、數(shù)字化檔案館、數(shù)字檔案館:該篇文章建議您自主創(chuàng)作。
來源:網(wǎng)絡(luò)整理 免責(zé)聲明:本文僅限學(xué)習(xí)分享,如產(chǎn)生版權(quán)問題,請聯(lián)系我們及時(shí)刪除。