您好, 歡迎來(lái)到包裝印刷網(wǎng)! 登錄| 免費(fèi)注冊(cè)| 產(chǎn)品展廳| 收藏商鋪|
行業(yè)產(chǎn)品
書(shū)籍掃描儀檔案數(shù)字化現(xiàn)狀和面臨的挑戰(zhàn)
l 歷史的狀況
檔案在中國(guó),無(wú)論是檔案的檔案館還是企、事業(yè)單位的資料室,大多數(shù)的檔案/資料是以紙介質(zhì)的形式存在,自八十年代以來(lái),很多的檔案/資料被翻拍成縮微膠片的形式,節(jié)省了大量的存儲(chǔ)空間,同時(shí)解決了紙介質(zhì)檔案/資料隨時(shí)間推移可用性不斷降低,維護(hù)成本不斷增加的問(wèn)題——也就是檔案/資料長(zhǎng)期保存的問(wèn)題。但是檔案/資料的價(jià)值是需要通過(guò)人們的廣泛利用來(lái)體現(xiàn)的,紙介質(zhì)和縮微膠片都沒(méi)有很好的解決檔案利用的問(wèn)題,相反為了使之可用,需要不斷的進(jìn)行資金設(shè)備的投入——這些資金可能用于庫(kù)房擴(kuò)建、溫控、殺菌防霉,庫(kù)房管理人員的工資等等。
目前網(wǎng)絡(luò)和計(jì)算機(jī)設(shè)備硬件價(jià)格逐漸降低,中國(guó)經(jīng)過(guò)十幾年的計(jì)算機(jī)和網(wǎng)絡(luò)設(shè)備的建設(shè),在各個(gè)檔案館、企事業(yè)單位中都有了各自的局域網(wǎng),在各個(gè)部委或是行業(yè),甚至是一些大的企業(yè)都各自有了自己的全國(guó)范圍內(nèi)的廣域網(wǎng)絡(luò)。這些網(wǎng)絡(luò)目前面臨的大問(wèn)題是網(wǎng)上數(shù)據(jù)量太小,沒(méi)有太多的可用數(shù)據(jù),使得投資巨大的網(wǎng)絡(luò)顯得得不償失。如果反過(guò)來(lái)看,這些網(wǎng)絡(luò)的建成和投入使用,恰恰為檔案/資料的檔案數(shù)字化后的成功應(yīng)用奠定了堅(jiān)實(shí)的基礎(chǔ)。那么檔案/資料的檔案數(shù)字化是不是購(gòu)置一些硬件設(shè)備——掃描儀計(jì)算機(jī)就可以完成檔案數(shù)字化的工作呢,答案是否定的。為什么?讓我們先看看我們的檔案/資料在沒(méi)有檔案數(shù)字化之前是什么樣的。
l 檔案數(shù)字化面臨的挑戰(zhàn)
無(wú)論是檔案還是資料,通過(guò)上面的分析,它們之所以被保存并能被利用,是因?yàn)槿藗兪占瘷n案/資料進(jìn)行保存時(shí),對(duì)其進(jìn)行了邏輯化的歸類(lèi)存儲(chǔ),同時(shí)建立了索取這些被歸類(lèi)的檔案/資料的目錄索引信息。當(dāng)人們需要某種信息時(shí),負(fù)責(zé)管理檔案的人員通過(guò)查閱這些索引信息,找到這些檔案/資料所在的位置后,將原件取出,供借閱人使用。顯然這種方式是我們熟知的方式,它的缺點(diǎn)也為人們所*的:速度慢,對(duì)原件損害程度大,不能實(shí)現(xiàn)多人對(duì)同一份檔案的同時(shí)共享。
如果能夠?qū)⑦@些紙面上的檔案/資料信息檔案數(shù)字化,那么上述*的缺點(diǎn)將不復(fù)存在。數(shù)字信息在網(wǎng)絡(luò)上以光的速度進(jìn)行傳輸,復(fù)制一份電子文件只需要幾秒鐘,而上百萬(wàn)卷的檔案/資料——要幾個(gè)庫(kù)房才能夠放下,現(xiàn)在只需要床頭柜大小的設(shè)備,就能夠存儲(chǔ)完畢,甚至還有可能顯得綽綽有余,對(duì)這些檔案的查詢(xún)速度,無(wú)論你是在地球的這邊還是那邊,幾秒鐘你就可以獲得您想要的檔案/資料,當(dāng)然前提是你有足夠的權(quán)限能夠訪(fǎng)問(wèn)這些信息。
事實(shí)的確如此,因而檔案/資料的檔案數(shù)字化,以一種不可逆轉(zhuǎn)的潮流席卷,無(wú)論是,工礦企業(yè),還是學(xué)校和私營(yíng)公司都在進(jìn)行檔案數(shù)字化加工的工作,與此同時(shí)檔案數(shù)字化的設(shè)備也層出不窮。當(dāng)我們用書(shū)刊掃描儀或者縮微設(shè)備中的縮微膠片掃描儀對(duì)每一份檔案/資料進(jìn)行掃描時(shí),我們必須像收集紙件檔案/資料那樣,建立相應(yīng)的索引信息,以便我們將來(lái)能夠?qū)ξ覀兯璩龅碾娮游募M(jìn)行檢索利用,而掃描儀不能像人一樣對(duì)掃描出的電子影像進(jìn)行組卷編目歸檔存儲(chǔ),所有這一切還必須有人來(lái)完成,至少在一定的軟件幫助下建立這些索引信息。
顯然,檔案/資料檔案數(shù)字化的困難在于:
是由于檔案/資料的數(shù)量巨大,少則上萬(wàn)頁(yè),多則上千萬(wàn)頁(yè),乃至上億頁(yè)。在掃描的過(guò)程中,都需要保證影像清晰,工整,對(duì)于檔案還要盡可能的保持檔案的原始風(fēng)貌,對(duì)于資料則盡可能的清新易于利用;
第二是檔案組卷后,有卷皮,卷內(nèi)目錄,文件,和備考表,資料可能有章、節(jié)、參考書(shū)目、關(guān)鍵字,中英文摘要等等,在掃描成電子影像的同時(shí),必須保證這些邏輯結(jié)構(gòu)。用于數(shù)據(jù)庫(kù)查詢(xún)所用的各類(lèi)條目信息,都是花費(fèi)了大量人力物力獲得的寶貴信息資源,如何將這些資源充分利用起來(lái),當(dāng)查閱這些信息的同時(shí)就能夠查到相應(yīng)的電子影像的文件,這是數(shù)字化面臨的另一巨大挑戰(zhàn);
第三是一旦進(jìn)行檔案數(shù)字化,檔案管理的對(duì)象不再是單純的紙質(zhì)檔案單一的載體,人們已經(jīng)習(xí)慣了打開(kāi)翻看就知道內(nèi)容的紙質(zhì)檔案,如何管理看不見(jiàn)摸不著,只能借助于計(jì)算機(jī)設(shè)備和相應(yīng)的軟件才能知道它是什么的電子檔案/資料,是擺在檔案管理人員面前的另一大挑戰(zhàn),不僅于此,如何保證各種檔案/資料各種介質(zhì)的統(tǒng)一或者說(shuō)一致性,是檔案管理的難題所在。
無(wú)論是檔案數(shù)字化還是檔案資料的管理,都不是我們的目的,我們的目的是為了利用檔案/資料,檔案/資料的數(shù)字化和數(shù)字化的管理,都是保證利用的前提和手段。
總結(jié)起來(lái),檔案/資料數(shù)字化的困難分三個(gè)階段,個(gè)階段是如何解決好不同紙質(zhì),不同裝訂形式,不同幅面的紙質(zhì)檔案/資料,能夠被快速的掃描,并保證掃描出的電子影像是優(yōu)質(zhì)的——即沒(méi)有黑邊、不偏、不斜內(nèi)容清晰完整,適合閱讀;第二個(gè)階段如何保證掃描出的電子影像保持與紙介質(zhì)相一致的邏輯結(jié)構(gòu);第三個(gè)階段是如何保證這些電子檔案/資料被方便的利用——和數(shù)據(jù)庫(kù)里的信息進(jìn)行銜接,能夠被利用者方便的查閱和使用;第三個(gè)則是檔案的安全性。
解決方案
面對(duì)數(shù)量巨大的檔案/資料,檔案數(shù)字化能行得通的辦法,是批量處理流水作業(yè)。就目前計(jì)算機(jī)技術(shù)而言,相當(dāng)多的后處理工作可以交給軟件系統(tǒng)來(lái)處理,根據(jù)各自保管的檔案/資料選取適合的掃描設(shè)備,通過(guò)軟件系統(tǒng)把這些設(shè)備處理出的結(jié)果進(jìn)行串聯(lián)和加工后,就能夠非??斓倪M(jìn)行檔案/資料的檔案數(shù)字化加工工作。
對(duì)于把紙件檔案/資料直接檔案數(shù)字化的用戶(hù),可能面臨的問(wèn)題是:
一、一卷檔案/一本資料無(wú)法用一種掃描儀完成每一頁(yè)的掃描任務(wù)。特別是在工程類(lèi)的檔案中,一卷檔案中有很小幅面的發(fā)票,也含有整個(gè)樓宇的建筑結(jié)構(gòu)圖,它可能是幅面A0或者A1的大型圖紙;一本資料中也可能含有書(shū)本幅面的圖紙、示意圖等,為了保證完成檔案/資料的數(shù)字化工作,可能需要不同幅面的書(shū)刊掃描儀參與檔案數(shù)字化加工的工作。
二、為了保證盡可能快的掃描速度,我們必須區(qū)分被掃描紙件的特征;對(duì)于紙質(zhì)優(yōu)良,拆解后再裝訂對(duì)原有的檔案/資料無(wú)重大損害的,應(yīng)當(dāng)采用相對(duì)的書(shū)刊掃描儀,這類(lèi)書(shū)刊掃描儀能快速的完成掃描任務(wù),而且包含了對(duì)影像質(zhì)量的即時(shí)處理的功能。
三、考慮到查閱和利用的方便性,必須保證檔案/資料查閱小單元的完整性和順序性。掃描設(shè)備在進(jìn)行掃描的過(guò)程中,有些能夠保證將掃描完成的幾頁(yè)合并成一個(gè)包含多頁(yè)的影像文件,但這需要人工干預(yù),而這種人工干預(yù)對(duì)掃描速度會(huì)有很大的損傷。此時(shí)需要軟件進(jìn)行后續(xù)處理,在掃描過(guò)程當(dāng)中加入適當(dāng)?shù)母綦x標(biāo)識(shí)。
四、 對(duì)于只能用低端書(shū)刊掃描儀進(jìn)行掃描的檔案/資料生成的電子影像,能夠在后期對(duì)影像進(jìn)行批量的質(zhì)量處理——糾偏,去黑邊,去麻點(diǎn),調(diào)整對(duì)比度等等設(shè)備性能的補(bǔ)償處理。
五、需要軟件輔助對(duì)掃描的電子影像進(jìn)行邏輯化的處理,并提供邏輯化處理出的結(jié)果進(jìn)行質(zhì)量檢驗(yàn)的手段,和對(duì)發(fā)生錯(cuò)誤后進(jìn)行調(diào)整的辦法。
六、提取歸檔的數(shù)字化檔案/資料的檢索信息,如果用戶(hù)已經(jīng)具備了大量的條目信息,則必須實(shí)現(xiàn)電子影像位置信息和數(shù)據(jù)庫(kù)條目信息的對(duì)接。對(duì)于沒(méi)有條目信息的用戶(hù)必須提供用戶(hù)錄入條目信息的窗口和操作界面,對(duì)于信息不完整的索引信息應(yīng)能進(jìn)行索引信息的批量補(bǔ)充工作,以實(shí)現(xiàn)對(duì)數(shù)據(jù)條目及全文的查閱。
綜上所述,紙件掃描檔案數(shù)字化加工,必須根據(jù)自己的檔案數(shù)字化對(duì)象具體分析,選取適應(yīng)的設(shè)備和相應(yīng)的后處理軟件,并結(jié)合自己對(duì)檔案數(shù)字化后的檔案/資料的利用方式,保證檔案數(shù)字化后的電子影像和提取的索引信息能夠被檢索系統(tǒng)所利用。
請(qǐng)輸入賬號(hào)
請(qǐng)輸入密碼
請(qǐng)輸驗(yàn)證碼
以上信息由企業(yè)自行提供,信息內(nèi)容的真實(shí)性、準(zhǔn)確性和合法性由相關(guān)企業(yè)負(fù)責(zé),包裝印刷網(wǎng)對(duì)此不承擔(dān)任何保證責(zé)任。
溫馨提示:為規(guī)避購(gòu)買(mǎi)風(fēng)險(xiǎn),建議您在購(gòu)買(mǎi)產(chǎn)品前務(wù)必確認(rèn)供應(yīng)商資質(zhì)及產(chǎn)品質(zhì)量。