Thứ Ba, 22 tháng 7, 2014

Lưu giữ văn bản điện tử làm thế nào để bắt kịp công nghệ thông tin

Việc triển khai rộng khắp và tích cực sử dụng văn bản điện tử, nhất là khi các văn bản điện tử “có giá trị pháp lý” thì sẽ làm nảy sinh sự cần thiết về việc lưu giữ lâu dài. Để làm điều đó, các doanh nghiệp sử dụng lưu trữ điện tử. Làm thế nào để tổ chức kho chứa, cần đặt ra những yêu cầu nào đối với kho chứa và đối với văn bản, đồng thời, cần tính đến các yếu tố nào để sau này không bị rơi vào tình huống là không truy cập được thông tin?

Văn bản điện tử được sử dụng rộng rãi trong hoạt động kinh tế và cả trong phạm vi quản lý nhà nước. Dĩ nhiên, từ đó nảy sinh nhiệm vụ lưu giữ lâu dài và để sử dụng tiếp theo, nghĩa là phải xây dựng lưu trữ văn bản điện tử.

Thuật ngữ “lưu trữ văn bản điện tử” thể hiện chính xác bản chất nhiệm vụ hơn là thuật ngữ “lưu trữ điện tử”, do tập trung được sự chú ý đến các vấn đề đặc thù trong việc tổ chức lưu văn bản điện tử mà có giá trị như văn bản gốc. Tự thân “lưu trữ điện tử” là một khái niệm rộng, bao quát tất cả mọi nhiệm vụ tự động hóa việc tổ chức lưu trữ, trong đó bao gồm việc chuyển đổi văn bản giấy sang dạng điện tử. (Nhưng đồng thời, bản gốc vẫn tồn tại dưới dạng văn bản giấy. Trong trường hợp này, các yêu cầu đảm bảo tính đích thực thấp hơn so với nguyên bản ở dạng điện tử).

Trên thực tế, để tiện lợi hơn người ta thường sử dụng thuật ngữ “lưu trữ điện tử”, và chúng ta sẽ làm như vậy. Với thuật ngữ này, các giải pháp phần mềm tổng thể sẽ có rất nhiều các tính năng mà có giá trị lớn đối với doanh nghiệp.

Những nhiệm vụ của lưu trữ điện tử

Cũng như lưu trữ văn bản giấy, lưu trữ điện tử cần phải giải quyết nhiệm vụ lưu văn bản điện tử một cách lâu dài và có độ tin cậy cao, bảo đảm truy cập thông tin theo trình tự quy định, đảm bảo tính toàn vẹn và đích thực.


Không được quên về giá trị lịch sử văn hóa của lưu trữ, trong đó có cả lưu trữ điện tử 

Tất cả điều này cho phép đảm bảo giá trị pháp lý của văn bản lưu trữ dưới dạng điện tử. Phần lớn các yêu cầu (khiếu nại) của công dân và tổ chức đều liên quan đến các tình huống tranh cãi, và thông thường các quyết định được đưa ra đều trên cơ sở các bản chứng nhận được lưu trữ.

Không được phép lãng quên giá trị lịch sử văn hóa của lưu trữ, điều này hoàn toàn có liên quan tới văn bản điện tử. Các nhà phân tích thường nói nhiều về sự gia tăng vũ bão của nội dung số, và nhiều thứ trong các nội dung đó hoàn toàn xứng đáng được lưu giữ. Không thể hy vọng rằng, thông tin sẽ viễn viễn tồn tại trên trang Web nào đó. Tốt hơn hết là các văn bản và các ấn phẩm quan trọng sẽ được lưu giữ một cách tin cậy. Điều đó có liên quan đến tất cả các lĩnh vực của đời sống xã hội: sự kiện chính trị, nghiên cứu khoa học, văn hóa, môi trường xã hội. Trong lưu trữ văn bản giấy không chỉ bao gồm các mệnh lệnh, hướng dẫn, hóa đơn, hợp đồng, hồ sơ cá nhân, chứng từ, khiếu nại, quyết định, phán quyết tòa án và các văn bản chính thức khác. Trong đó còn có cả phông tư liệu cá nhân của các nhà hoạt động chính trị, nhà văn, nhạc sĩ, đạo diễn và những người nổi tiếng khác. 

Lưu trữ truyền thống

Nhu cầu lưu giữ dữ liệu lâu dài theo định dạng số đã xuất hiện đồng thời cùng với sự ra đời của những máy tính điện tử đầu tiên. Quả thật, sau khi cắt nguồn điện, toàn bộ nội dung trong bộ nhớ máy tính đều bị xóa bỏ. Có cảm tưởng rằng, trong mỗi nhà đều có thể tìm thấy một hộp có ghi dòng chữ “lưu trữ”, nhưng không thể đọc được.

Công nghệ lưu thông tin luôn phát triển, dữ liệu được tích lũy, và cũng bắt đầu xuất hiện những kho lưu trữ điện tử đầu tiên. Nguyên nhân chính là do các hạn chế kỹ thuật: các đĩa từ có giá trị đắt, dung lượng nhỏ. Cho nên cần phải chuyển các thông tin ít dùng sang các thiết phụ trợ ngoài để ghi dữ liệu như băng từ, đĩa CD/DVD...

Nhiệm vụ của công việc lưu trữ trong ngữ cảnh này (nghe có vẻ rất hợp lý) thường do bộ phận công nghệ thông tin (CNTT) đảm nhận, và họ thực hiện công việc của mình bằng thủ tục sao lưu dự phòng đơn giản, một công việc rất mang tính kỹ thuật. Đương nhiên, các quy tắc lưu trữ ở đây hoàn toàn không được áp dụng.

Tiếc rằng, phương pháp này vẫn còn đang chiếm vị thế độc tôn, và nhiều dữ liệu có ý nghĩa quan trọng trong hoạt động của doanh nghiệp được “lưu trữ” bởi các chuyên gia CNTT, những người thường không hình dung hết các rủi ro về mặt pháp lý mà có liên quan đến các văn bản này. Ví dụ, trong phần lớn các “kho lưu trữ” như vậy người ta thiên về thu thập thông tin khi dung lượng thiết bị còn cho phép mà hoàn toàn không nghĩ đến việc phải hủy bỏ chúng khi cần thiết. Còn trong thế giới hiện đại thì văn bản không được hủy bỏ kịp thời có thể tạo ra thêm những vấn đề không đáng có. 

Cùng với việc xuất hiện máy quét, trong xã hội có thêm các ngành nghề khác như: số hóa văn bản giấy. Có thể thấy rõ các ưu việt: khuôn dạng điện tử không bị hao mòn, không thể gây hư hỏng hoặc bị loại bỏ khỏi lưu trữ, có thể được sử dụng chung bởi nhiều người. Ngày nay, nhiều phông lưu trữ trên thế giới đã được chuyển sang định dạng số, và công việc này vẫn đang được tích cực diễn ra. Đến lúc nào đó, tất cả các kho lưu trữ truyền thống sẽ được chuyển sang dạng điện tử, nhưng có điều chắc chắn, là không phải trong tương lai gần.   
                                                                        
Ở đây có một khía cạnh khác thú vị hơn. Những người đặt hàng các giải pháp số hóa thường là các bộ phận và cơ quan lưu trữ, cho nên các hệ thống thông tin này có nhiều điểm được coi là hệ thống lưu trữ điện tử nhiều hơn so với các giải pháp của bộ phận CNTT tự xây dựng. Nhưng mặt khác, hệ thống lưu trữ điện tử như vậy thường chỉ được hướng tới một nhiệm vụ, đó là quét ảnh và chuyển thành dạng số, và thường tồn tại tách biệt với các hệ thống thông tin khác trong doanh nghiệp, ví dụ như hệ thống quản lý văn bản điện tử

Lưu giữ lâu dài văn bản điện tử

Lưu giữ dưới định dạng số (Digital Preservation) là toàn bộ các biện pháp cần thiết nhằm đảm bảo khả năng sắp đặt, trình bày, sử dụng và nhận biết các đối tượng số trong tương lai.

Có thể nói, đây là nhiệm vụ chính của lưu trữ điện tử: điều quan trọng ở đây không chỉ là việc lưu các văn bản điện tử hiện nay mà là xây dựng các điều kiện để có thể sử dụng các văn bản đó sau này mà vẫn bảo lưu tính đích thực và toàn vẹn. Chúng ta sẽ làm rõ hơn những vấn đề đặc thù nào cần giải quyết để đảm bảo lưu giữ lâu dài các văn bản điện tử.

Trong những thập niên gần đây, ngành CNTT phát triển rất nhanh, con người được sử dụng nhiều công nghệ mới, và ít ai nghĩ rằng, các dữ liệu số này cần được lưu giữ như các văn bản được cất giữ theo cách truyền thống. Cho dù đã có được một số kinh nghiệm tổ chức bảo quản phim ảnh và âm thanh, nhưng nói chung, các cơ quan lưu trữ quốc gia của nhiều nước trên thế giới vẫn còn chưa sẵn sàng để đến với thông tin số.

Không ngạc nhiên khi có nhiều các nghiên cứu và dự án quốc tế dành cho đề tài này. Lưu trữ điện tử khác với lưu trữ giấy, không thể xem đó là hệ thống tĩnh, chỉ cần một lần đưa một cái gì đó vào thì có thể yên tâm 100 năm sẽ vẫn tồn tại. Môi trường mà trong đó văn bản điện tử tồn tại cực kỳ khả biến và sinh động. Máy vi tính, phương tiện ghi thông tin, hệ điều hành, giải pháp ứng dụng, định dạng tệp có thể được thay đổi, còn các thuật toán phần mềm tính toán thì vẫn tồn tại mãi mãi.

Cho nên, ở đây điều quan trọng là cần phải đảm bảo tính bất biến của nội dung và các thuộc tính (metadata – siêu dữ liệu) của văn bản. Và cần phải chắc chắn rằng, nội dung không bị thay đổi. Chỉ khi đó, văn bản điện tử mới có thể được thừa nhận là đích thực. Nhiệm vụ đó không thể được giải quyết chỉ bằng các phương tiện kỹ thuật. Rõ ràng, cần phải xây dựng một loạt các tiêu chuẩn và thủ tục, đồng thời cần làm mọi cách để sao cho nó được xã hội thừa nhận. Chỉ trong trường hợp này mới có thể nói về việc ứng dụng văn bản điện tử một cách rộng khắp, khi mà tính chân thực của văn bản có thể được bảo đảm trong một thời gian dài. 

Lưu ý đặc biệt đối với định dạng tệp

Trong quá trình làm việc, mọi người thường không nghĩ đến định dạng mà văn bản được lưu giữ. Ví dụ, đối với các tài liệu công việc, thường sử dụng các định dạng của các ứng dụng văn phòng. Nhưng khi lập kế hoạch lưu trữ các văn bản trong thời hạn tối thiểu là 10 năm thì nhất thiết cần phải tính đến yếu tố này. Các định dạng này có được tiếp tục hỗ trợ hay không? Có còn tồn tại công ty mà nghĩ ra định dạng này hay không? Thậm chí nếu chúng ta lưu giữ các tệp này một cách cẩn thận thì làm thế nào để có thể đọc ra?

 

Trong quá trình làm việc, mọi người thường không nghĩ đến định dạng mà văn bản được lưu giữ

Đáng tiếc, các định dạng của các hãng phần mềm thường ở dạng đóng, và nếu một hãng quyết định ngừng hỗ trợ định dạng đó thì sau này chỉ có thể đọc các tệp này nhờ các phần mềm cũ, chỉ được khởi động chỉ trên hệ điều hành cũ, và chỉ làm việc trên các máy tính cũ. Làm thế nào để tìm được những thứ đó sau 20 năm nữa?

Giải pháp có thể là sử dụng các định dạng văn bản mở, như ODF, TIFF, PDF/A và các định dạng khác tùy thuộc vào dạng nội dung. Trong trường hợp này, thậm chí nếu hãng ngừng hỗ trợ phần mềm ứng dụng thì vẫn có thể viết ra một ứng dụng trên nền tảng mới để đọc các văn bản cũ.

Cần hiểu rằng, yêu cầu này không có nghĩa là phải chuyển tất cả người sử dụng sang làm việc với gói phần mềm văn phòng mới. Chỉ cần đảm bảo việc chuyển đổi tệp văn bản khi đưa chúng vào lưu trữ điện tử, đồng thời, gắn thêm công cụ phần mềm để xem văn bản theo định dạng mới.

Vẫn còn có một số rủi ro khác liên quan do không chú ý tới các định dạng tệp được dùng. Thứ nhất, đó là vấn đề về thông tin ẩn. Các văn bản văn phòng đều có chứa dữ liệu về những lần chỉnh sửa trước đó, các ghi chú, nội dung ẩn, thông tin về công ty và tác giả. Trong phiên bản cuối, tất cả đều là thừa và không cần đưa vào lưu trữ điện tử

Thứ hai, tác giả có thể sử dụng các trường ([Field]) trong văn bản mà giá trị trường đó có thể thay đổi, làm sai lệch nội dung văn bản. Một ví dụ đơn giản: trường với ngày hiện tại. Hãy thử hình dung: chúng ta in một bản sao từ bản lưu trữ, nhưng trên tiêu đề văn bản lại được đề ngày hiện tại…

Thứ ba, văn bản có thể chứa các đường dẫn (hyperlink) tới các trang Web hoặc các đối tượng có liên quan khác như (hình vẽ, sơ đồ và các văn bản khác). Đôi khi, việc này cần thiết để thuận tiện sử dụng và để hiểu văn bản đó. Nhưng khi đưa văn bản này vào lưu trữ thì cần phải làm gì đó, ví dụ, lưu giữ nội dung trang Web vào cùng văn bản.

Những yếu tố này cần được tính đến khi xây dựng quy tắc tiếp nhận văn bản vào lưu trữ điện tử. Nói bằng ngôn ngữ kỹ thuật, văn bản cần được chuyển đổi sang định dạng đã phê duyệt, ví dụ như định dạng ODF, để loại trừ các rủi ro nêu trên. 

Định chế lưu trữ điện tử

Như đã nói ở trên, không thể xây dựng hệ thống lưu trữ điện tử thành công chỉ bằng các biện pháp kỹ thuật. Cần phải xây dựng các định chế làm việc để tạo ra một môi trường tin cậy và tổ chức quy trình làm việc nhằm đảm bảo tính đích thực và toàn vẹn của văn bản điện tử trong lưu trữ.

Nếu văn bản được đưa vào hệ thống mà tuân thủ đầy đủ các thủ tục quy định, và trong quá trình lưu giữ, tất cả các hành động liên quan tới văn bản đều được kiểm soát nghiêm ngặt thì có thể mạnh dạn khẳng định, văn bản đó sẽ tồn tại bất biến và có giá trị pháp lý. Ở mức độ chính sách và thủ tục làm việc với văn bản (bao gồm văn bản điện tử và văn bản giấy), có thể sử dụng tiêu chuẩn ISO 15489 như là một tài liệu mang tính định hướng. 


Không có nhận xét nào:

Đăng nhận xét