經濟日報-中國經濟網北京11月26日訊(記者 成琪) 2019年科技部等六部門印發的《關于促進文化和科技深度融合的指導意見》 中提出,加快國家文化大數據體系建設。據經濟日報-中國經濟網記者了解,截止到發稿時,已有10余個省份相繼出臺了推進國家文化大數據體系建設的方案或實施意見。11月19日,國家文化大數據8個區域中心首次公開亮相并正式授牌成立,至此,國家文化大數據體系建設正在全國穩步有序推進。
日前,在“文化大數據產業論壇”上,中宣部文改辦一級巡視員、副主任高書生表示,文化大數據建設是宣傳文化戰線的新基建,是為了適應新時代文化建設的新要求,順應文化和科技深度融合的新趨勢,加強宣傳文化事業發展的信息化基礎的重大舉措。“文化大數據建設,開啟了不一般的新基建。”
文化大數據的五個關鍵詞
高書生用五個關鍵詞梳理了文化大數據體系架構:供給端、生產端、需求端、云端以及有線電視網絡。四個端通過有線電視網絡連接到一起。
供給端主要有三個庫:第一個是中國文化遺產標本庫;第二個是中華民族文化基因庫;第三個是中華文化素材庫。高書生指出,供給端是文化大數據與其他大數據最大的不同。
中國文化遺產標本庫,主要是依托現有的工作基礎,把這些年來國家開展多次文化資源普查取得的數據,導入國家文化大數據體系底層關聯集成系統,對普查數據作標準化、結構化處理,不需要再投入數據采集資金。中華民族文化基因庫,主要是對革命博物館紀念館以及國家一級博物館收藏的珍貴文物進行高精度數據采集,導入國家文化大數據體系底層關聯集成系統,完成標注、關聯,提取中華文化的元素、符號和標識,形成中華民族文化基因庫。中華文化素材庫的來源是多元化的,其中一個途徑就是通過對中國文化遺產標本庫和中華民族文化基因庫積累的數據進行解構,形成中華文化素材庫。此外,目前許多文化機構建成了各類數據庫,但都是數據“孤島”,如果把數據導入國家文化大數據體系底層關聯集成系統,就可以通過有線電視網絡實現全國聯網,在全國范圍內展示、開發和變現。
生產端包括三個方面的內容:第一個數據采集和清洗,第二個是數據標注關聯,第三個是數據解構和重構。這三項統稱為數字化文化生產線。
需求端就是利用新技術、新裝備,打造場景化、沉浸式、互動性的文化體驗場景:第一個是文化體驗園,規模比較大,主要是在旅游景區和旅游度假村。第二個是文化體驗館,主要面向中小學校和商場。第三個是文化體驗廳,主要面向社區,包括城市社區和農村社區,還有就是新華書店等。
“我想提醒的是,文化體驗園不等于現在的主題公園,最大的區別是文化體驗園的內容不斷的更新,天天更新、時時更新,有一個龐大的生產體系在里面”。高書生說。
云端主要是依托有線電視網絡來架構,叫國家文化專網。國家文化專網包括三個層次:第一個是省域中心,任務是把本省內的供給端、生產端、需求端連到一起,實現數據、產品的確權、交易和結算、支付。第二個是區域中心,目前已授牌8個,其中6個是行政大區類的區域中心,還有2個是專業化中心,他們的任務就是把省域中心連到一起,達到承上啟下,上連接全國中心,下連接省域中心。最后一個就是全國中心,區域中心的基礎之上形成全國中心——國家文化大數據體系的中樞。
文化大數據建設遵循一般原則
第一堅持物理分散、邏輯集中。現在大量的數據實際上是分散在各個文化機構,包括公共文化機構和文化生產機構,像電視臺、出版社、演出公司、設計公司等等。如何把他們集中起來?高書生表示,文化大數據建設也遵循國家大數據建設的一般原則,堅持物理分散、邏輯集中。“如果把數據集中到一起,既不現實也不必要,遵循物理分散的原則,各個文化機構自建或租賃數據中心,但必須邏輯集中,執行國家文化大數據體系的一系列標準,當前最重要的是導入國家文化大數據體系的底層關聯集成系統。”
標準是什么呢?高書生提出了標準三個最核心的點:第一標識每個數據,第二實現數據之間的關聯,第三數據能夠解析。“這是邏輯集中里最主要的,也是文化大數據底層關聯集成系統最核心的。”
此外,文化大數據建設與國家大數據建設一致,合理布局數據中心,構建區域級數據中心集群和智能計算中心。“要建設全國一體化數據中心,千萬不要做成數據孤島。”
文化大數據建設的不一般
有相同也有不同,在高書生看來,文化大數據與其他大數據相比,也有自己的特點。“文化大數據體系是一個開放的體系,不是一個封閉體系。”
首先,需求不是來自于需求側,而是來自于供給側。“比如中華傳統紋樣、文物藏品圖像、紅色經典影像、珍貴歷史影像、中華經典古籍、古代服飾圖解、傳統農具圖鑒等等都是供給端的。”高書生進一步闡釋。“理解大數據首先從供給端開始。”文化大數據體系不只是消費互聯網,更是生產互聯網,也就是產業互聯網。消費對應的是生產,而產業互聯網除了有生產端,還有供給端、需求端。
其次,國家文化專網在文化生產上是閉環,但閉環不等于封閉,而是為了數據安全。高書生指出,標本庫和基因庫都是國家所有,是具有公益屬性的專業數據庫。“公益屬性就是國家出資建設,是國家行為,如果說有版權也是公權,而非私權。”
第三是生產線守正不守舊。文化大數據來源于國家的公共文化機構和文化生產機構。“在內容上我們用的是守正,數據來源要保真。創作要嚴謹,互動有序、內容要把關。同時我們堅持創新。”高書生說。
第四是生產閉環消費開環,“在生產過程中,為了保證數據的安全必然是閉環,但是消費必須是開環的。”
關聯數據是核心資產
如何理解國家文化大數據體系這些數據的關系呢?高書生提出了六個點。
一是在國家文化大數據體系中,數據是核心要素,而且是生產要素。
二是經過關聯后的數據是核心資產。“文化大數據當中最有價值的是關聯數據,也就是數據之間的關系,數據和實物之間的做了關聯以后的數據,這是核心資產。”
三是數據關聯是核心生產力。生產端生產線要做的就是把數據關聯到一起,這是核心生產力。
四是數據的變現是核心驅動力,如果沒有變現數據都是死數據。
五是數據安全是核心競爭力。如果沒有數據安全,這個體系就沒有價值。
六是生產端、生產線、生產網是這個體系核心環節。