首頁>文化>藝文
加快文化數據體系開放共享
張自成
5月5日至5月12日,我隨全國政協文化文史和學習委員會“實施國家文化數字化戰略,推動數字文化產業高質量發展”調研組赴湖南、廣西調研,一路走來,感觸頗深。
國家文化數字化戰略,旨在構建從文化資源到文化生產再到文化傳播、文化消費的全新體系。設計的技術路線一是建設一條專網——國家文化專網,依托現有有線電視網絡設施、廣電5G網絡和互聯互通平臺,形成閉環的國家文化專網;一是布置一套標識解析體系,即部署一套提供數據標識編碼注冊登記和解析服務的技術系統。
調研過程中得知,湖、桂兩省目前大致已建成區域性或局部性技術底座,建立了一些生產技術系統和云平臺,建立了覆蓋面較為全面的傳播體系,初步實現了區域或局部資源數字化和資源共享,比如蘋果TV和智慧廣西工程、一鍵游廣西等;實施的重大項目、主要成果主要側重于應用和工具層面,比如AI主播、數字人、云展覽、云視頻、云課程、云上音樂會、虛擬展廳等。
對此,我有幾點想法:
一是進一步完善國家文化數字化戰略路徑選擇。一般認為,大數據具有四大特征,即4V特征,指數據量大(Volume)、類型多樣(Variety)、高速成長(Velocity)、價值密度(Value),其中價值密度即大數據價值居核心地位,其數據總量與其價值密度的高低成反比,也就是數據量越大,價值越低,有大量的冗余。任何有價值的信息都是在處理海量的基礎數據基礎上提取的。這就要求大數據體系或者說平臺的建設必須是開放的,不能是閉環的,不能只關注存量,不關注增量。而從相關人員的解讀看,國家文化大數據體系(國家文化專網)的建設是閉環的,這一路徑選擇需要完善,應該采取開放的思路。
二是完善文化數字化基礎工作的缺環項。文化數字化基礎工作有兩項:一是技術支撐體系,即所謂文化數字化新基建,包括生產線(平臺)、傳播體系、相關技術工具等;二是內容體系,包括數據庫的建設、貫通,大規模數據標注和系統化、規范化整理,以及數據關聯等。從調研情況看,目前存在重前者而輕后者的傾向。如不改變,可能會出現技術系統或平臺空轉的現象。
此外,調研中了解到,在數據庫的建設上,目前普遍強調的是數據采集和入庫標準,而對數據標注、整理、關聯標準關注不夠。長期如此,可能會出現數據庫數據成為死數據的現象。因為沒有數據處理標準,就沒有數據化,也就沒有數據關聯、知識生成,進而影響文化數字化戰略的持續推進。
三是加快公共文化機構數字化數據的開放共享與應用。按照目前技術發展速度,數據技術標準、格式通常6年會升級一代,也就是說數據尤其是音視頻數據都有生命周期的,不會一勞永逸。雖然技術標準、格式升級一般會上下兼容,但超過一定時限兼容就會比較困難,這就要求數據要不斷維護升級。數據的維護、升級只有在應用中才是最經濟的,反之就會付出巨大成本。因此應加快公共文化機構數據的開放與共享,在不斷創新應用中推動數據的維護升級。
(作者系全國政協委員,文物出版社社長、黨委書記)
編輯:陳姝延