Hỏi Đáp

DSPACE, giải pháp phần mềm cho thư viện điện tử quản lý và khai thác nguồn thông tin số nội sinh ở những trường đại học Hiện tại

Yêu cầu quản lý những nguồn thông tin số nội sinh ở những trường đại học và sự ra đời của những phần mềm quản lý bộ sưu tập số

Hoạt động đào tạo và nghiên cứu khoa học ở những trường đại học tự nó đã tạo ra một khối lượng tài liệu đặc biệt có giá trị. đó chính là những giáo trình, những tập bài giảng của giảng viên, những khoá luận tốt nghiệp của sinh viên, những luận văn thạc sỹ của học viên, những luận án tiến sỹ của nghiên cứu sinh, những công trình nghiên cứu khoa học của giảng viên và sinh viên đăng tải trên những tạp chí khoa học, và những kỷ yếu hội nghị khoa học… Chúng được gọi chung là nguồn tài liệu nội sinh và thông tin mà những nguồn tài liệu này cung cấp được gọi là nguồn thông tin nội sinh.

Dspace Là gì vậy

Nguồn thông tin nội sinh của trường đại học là tác nhân phản ánh đầy đủ và hệ thống những thành tựu và tiềm năng khoa học của một trường đại học và có vai trò quan trọng trong công tác đào tạo của nhà trường. những nguồn thông tin này ngày càng phong phú, đa dạng và luôn chứa đựng những thông tin mới nhất trong lĩnh vực mà nó xem xét, rất cần được quản lý và khai thác một cách hiệu quả.

Bạn đang đọc: DSPACE, giải pháp phần mềm cho thư viện điện tử quản lý và khai thác nguồn thông tin số nội sinh ở những trường đại học Hiện tại

Một thuận lợi là những nguồn thông tin này thường được lưu trữ dưới dạng tệp văn bản, tức là đã được số hoá và về cơ bản nhà trường có quyền sử dụng, không gặp nhiều khó khăn trong vấn đề bản quyền.

Ở nước ta, từ đầu những năm 2000, nhiều trường đại học đã tăng cường ứng dụng công nghệ thông tin để hiện đại hoá thư viện theo hướng xây dựng thư viện của mình theo mô hình thư viện điện tử. những thư viện điện tử này trước hết có chức năng quản lý và khai thác nguồn thông tin số nội sinh toàn văn của trường.

Phần mềm được lựa chọn là những hệ quản trị thư viện tích hợp như: LIBOL của Công ty Tinh Vân, ILIB của Công ty CMC hay Virtua của Công ty VTLS Hoa Kỳ. Tuy nhiên, qua thực tế ứng dụng, những phần mềm này còn bộc lộ nhiều hạn chế, nhất là trong khâu quản lý và khai thác nguồn thông tin số toàn văn.

Trong thực tế những phần mềm này mới chỉ chú ý tới quản lý những cơ sở dữ liệu (CSDL) thư mục, và với việc áp dụng chuẩn biên mục đọc máy MARC 21 và thực hiện tìm tin trên OPAC. Và như vậy, thư viện chưa thể trở thành thư viện điện tử đúng nghĩa. Bởi vì thư viện chỉ trở thành thư viện điện tử khi người đọc có thể đọc trực tiếp toàn văn một bộ phận quan trọng tài liệu của thư viện trên máy tính.

Tìm hiểu thêm: Định nghĩa seller là gì vậy? Nghề seller có đáng tự hào

Yêu cầu quản lý và khai thác những nguồn thông tin số đang phát triển bùng nổ, mang tính toàn cầu trong những năm gần đây, cùng với những yêu cầu phát triển của thư viện điện tử, mà những bộ sưu tập số toàn văn là thành phần cốt lõi, đã dẫn đến sự ra đời và phát triển những phần mềm quản lý bộ sưu tập số, trong đó đáng kể nhất là hai phần mềm Greenstone và DSpace.

Greenstone có tên đầy đủ là Greenstone Digital Library (GSDL), là phần mềm mã nguồn mở hỗ trợ việc xây dựng và phân phối những bộ sưu tập số của thư viện trên Internet hoặc trên CD-ROM. những bộ sưu tập số có thể bao gồm những tài liệu số dưới nhiều dạng thức khác nhau: văn bản, âm thanh, hình ảnh tĩnh và động. Những tài liệu không thuộc dạng chữ được liên kết với những tài liệu dạng chữ hoặc được mô tả dạng chữ (ví dụ: chú thích cho những ảnh) để hỗ trợ việc tìm kiếm theo nội dung.

Greenstone là kết quả của dự án thư viện số tại trường đại học Waikato, NewZealand (NewZealand Digital Library Project) với sự hợp tác của hai tổ chức UNESCO và Human Info NGO.

Phiên bản Greenstone đầu tiên phát hành vào tháng 8/2000. Mục đích của phần mềm Greenstone là trao quyền cho người sử dụng, đặc biệt là thư viện những trường đại học để xây dựng thư viện số cho riêng mình và chia sẻ nguồn lực thông tin trong cộng đồng. Greenstone được sử dụng khá rộng rãi trong những trường đại học và nhiều tổ chức nghiên cứu trên thế giới.

DSpace là phần mềm mã nguồn mở hỗ trợ giải pháp xây dựng và phân phối những bộ sưu tập số trên Internet. DSpace do thư viện của Học viện Công nghệ Massachusetts (Massachusetts Institute of Technology Libraries – MIT Libraries) và phòng thí nghiệm của Hewlett-Packard (HP Labs) phát triển. Phiên bản DSpace đầu tiên phát hành vào tháng 11/2002, với chức năng ban đầu là đáp ứng yêu cầu quản lý những kết quả nghiên cứu, những tài liệu giảng dạy và học tập đã số hoá của MIT.

DSpace cung cấp một công cụ hoàn chỉnh để quản lý những tài liệu khoa học của MIT trong một kho lưu trữ kỹ thuật số chuyên nghiệp, luôn được duy trì và tái tạo, dễ dàng truy cập và hiển thị tại bất cứ thời điểm nào.

Tháng 7/2007, do cộng đồng người sử dụng DSpace ngày càng mở rộng, MIT và HP Labs thành lập ra DSpace Foundation để lãnh đạo và hỗ trợ sự phát triển của DSpace. Ngày nay DSpace và cộng đồng người sử dụng nhận sự lãnh đạo và hướng dẫn từ DuraSpace (Một tổ chức phi lợi nhuận ra đời tháng 5/2009, kết quả của sự hợp tác của DSpace Foundation và tổ chức Common).

Trong hai phần mềm nói trên, phần mềm DSpace tỏ ra có nhiều ưu điểm nổi trội. Hiện tại trên thế giới đã có hơn 1.100 trường đại học, và thư viện và những tổ chức sử dụng DSpace để quản lý, khai thác và chia sẻ nguồn tài nguyên thông tin số của mình.

Tại Việt Nam, trong những năm gần đây đã có nhiều đơn vị ứng dụng DSpace để xây dựng thư viện điện tử, quản lý và khai thác những nguồn thông tin số dưới dạng những bộ sưu tập số cho thư viện của mình. Trong những đơn vị ứng dụng DSpace thành công có thể kể: Trung tâm Thông tin – Thư viện Đại học Đà Lạt, Thư viện Đại học Quốc gia Hà Nội, Thư viện Trung tâm Đại học Quốc gia Tp. Hồ Chí Minh, Thư viện Đại học Công nghiệp Tp. Hồ Chí Minh, Trung tâm Thông tin – Thư viện Đại học Nguyễn Tất Thành, Thư viện Đại học Lạc Hồng, Thư viện Đại học Nội vụ Hà Nội…

Tại trường Đại học Văn hoá Hà Nội, trang thư viện số của trường được xây dựng trên cơ sở ứng dụng DSpace đã khai trương ngày 26/3/2014, nhân kỷ niệm 55 năm ngày thành lập trường. những bộ sưu tập số được quản lý và khai thác ở đây là những nguồn thông tin số nội sinh toàn văn của trường, bao gồm:

alt

– Bộ sưu tập những bài giảng.

– Bộ sưu tập những bài tạp chí.

– Bộ sưu tập những khoá luận tốt nghiệp.

– Bộ sưu tập những luận văn thạc sỹ, tiến sỹ.

Qua thực tiễn ứng dụng, DSpace tỏ ra là giải pháp hiệu quả cho việc xây dựng thư viện điện tử, quản lý và khai thác nguồn thông tin số toàn văn nội sinh ở những trường đại học nước ta Hiện tại.

Nghiên cứu những đặc trưng tính năng và công nghệ của DSpace là một công việc cần thiết và có ý nghĩa. Những tính năng nổi trội của DSpace sẽ góp phần làm sáng tỏ và mở rộng những kết quả đã đạt được trong thực tiễn ứng dụng DSpace để quản lý và khai thác những nguồn thông tin số nội sinh ở những trường đại học nước ta Hiện tại.

Những đặc trưng tính năng và công nghệ của DSpace

Phần mềm quản lý bộ sưu tập số DSpace có những đặc trưng tính năng và công nghệ sau:

(1) DSpace là phần mềm quản lý bộ sưu tập số mã nguồn mở, hỗ trợ người sử dụng có thể tự xây dựng những bộ sưu tập số cho thư viện của mình.

những bộ sưu tập số được xây dựng riêng lẻ, thông qua sự giống nhau nổi bật của những tài liệu, thường xuyên được duy trì, được cập nhật bổ sung và tự động tái tạo. những tài liệu đưa vào bộ sưu tập có thể chọn từ máy tính hay tải về từ Internet.

Để tạo thuận lợi cho người sử dụng, mô hình hệ thống thông tin trong DSpace được xây dựng trên ý tưởng: một hệ thống thông tin bao gồm nhiều đơn vị thành viên. Có thể tạo nhiều đơn vị cùng cấp. Mỗi đơn vị thành viên lại có nhu cầu riêng trong việc tổ chức thông tin trong những bộ sưu tập. Như vậy, những bộ sưu tập phải được tạo ra bên trong một đơn vị. Mỗi bộ sưu tập quản lý một loại tài liệu số cụ thể của đơn vị đó.

Ví dụ: Trong thư viện số của một trường đại học có những đơn vị: KHOA, PHÒNG BAN, TRUNG T M.

Xem thêm: NEAR coin Là gì vậy? Triển vọng của dự án NEAR Protocal & ưu khuyết

Trong đơn vị KHOA chẳng hạn lại có những bộ sưu tập: GIÁO TRÌNH – BÀI GIẢNG, BÀI TẠP CHÍ, LUẬN VĂN…

Với cấu trúc như trên, DSpace cho phép xây dựng những bộ sưu tập theo cấu trúc nhiều cấp, giúp việc tổ chức các bộ sưu tập khoa học hơn so với Greenstone.

những bộ sưu tập số trong DSpace có khả năng lưu trữ thông tin với dung lượng lớn, hàng vạn, hàng triệu tài liệu.

(2) DSpace có khả năng xử lý những tài liệu đa phương tiện với nhiều định dạng tệp tin khác nhau, trong đó có những định dạng tài liệu văn bản (doc, và txt, rtf, pdf, html, xml…), định dạng tài liệu về hình ảnh (gif, jpg…), định dạng những tài liệu âm thanh (wav, flv, mp3, mp4…).

Với khả năng nhận biết được 64 định dạng tệp tin, có thể nói DSpace tương thích với hầu như tất cả những định dạng tệp tin, từ những định dạng đối với tài liệu văn bản đến những định dạng đối với tài liệu âm thanh, hình ảnh, video ca nhạc…

(3) DSpace sử dụng sơ đồ siêu dữ liệu Dublin Core Metadata để mô tả tài liệu trong những bộ sưu tập.

Dublin Core Metadata là một trong những sơ đồ siêu dữ liệu phổ biến được hình thành lần đầu tiên vào năm 1995. Tập hợp những tác nhân siêu dữ liệu này được coi là cốt lõi (core) vì nó được thiết kế đơn giản và chỉ bao gồm 15 trường cốt lõi nhất (trong khi MARC 21 gồm hơn 200 trường và rất nhiều trường con). Dublin Core Metadata đơn giản trong tạo lập và bảo trì, được thiết kế phục vụ những người không chuyên, dễ sử dụng nhưng mang lại hiệu quả lớn.

Mục đích đầu tiên và yêu cầu cốt yếu nhất của siêu dữ liệu là góp phần mô tả và tìm lại những tài liệu điện tử trên mạng Internet, vốn là những tài liệu khó xác định loại hình và nội dung những tác nhân cần thể hiện.

Khi mô tả tài liệu trong DSpace, ba trường bắt buộc là: nhan đề, tác giả và năm xuất bản. những tác nhân khác như nhà xuất bản, tóm tắt, từ khoá, chủ đề, ngôn ngữ, loại hình tài liệu… là tuỳ chọn, phụ thuộc vào tài liệu khi cập nhật. Trong DSpace những trường này được hiển thị trong biểu ghi thư mục của tài liệu và được định chỉ mục, và phục vụ cho việc duyệt xem thông tin và tìm tin.

(4) Toàn bộ những thao tác như biên mục, và bổ sung, duyệt xem và tìm kiếm tài liệu, quản trị hệ thống… trong DSpace đều được thực hiện trên nền giao diện web (web-based interface). Có giao diện dành cho người nhập tài liệu vào hệ thống, có giao diện dành cho người sử dụng tin để tìm kiếm thông tin, có giao diện dành cho người quản trị hệ thống.

Giao diện dành cho người nhập tài liệu vào hệ thống giúp việc biên mục và bổ sung tài liệu vào những bộ sưu tập dễ dàng. Khi cần bổ sung tài liệu vào những bộ sưu tập không cần phải xây dựng lại từ đầu như Greenstone.

Vì DSpace là phần mềm mã nguồn mở nên giao diện dành cho người quản trị hệ thống cho phép cải tiến cách trình bày và mở rộng khả năng ứng dụng của phần mềm. Ví dụ, có thể tạo những đường link để kết nối với thư viện điện tử của những trường đại học khác.

Đối với tất cả những bộ sưu tập, DSpace đều cung cấp một giao diện đồng nhất cho phép người sử dụng tin có thể duyệt xem và tìm kiếm dễ dàng những tài liệu. Có thể duyệt xem và tìm trong một bộ sưu tập. Cũng có thể duyệt xem và tìm trong một đơn vị, tức là trong nhiều bộ sưu tập của đơn vị. Nhưng khi đó diện tìm sẽ rộng hơn.

Kết quả tìm kiếm sẽ hiển thị đầu tiên dưới dạng một danh sách những tài liệu tìm được, và với ba cột thông tin là năm xuất bản, nhan đề và tác giả. Thông tin đầy đủ về mỗi tài liệu được hiển thị dưới dạng một biểu ghi thư mục. Để xem nội dung của tài liệu, cần tải tài liệu về và sử dụng một phương tiện thích hợp với dạng thức của tài liệu.

Ví dụ:

Muốn hiển thị một văn bản lưu ở dạng PDF (Adobe’s Portable Document Format) thì cần sử dụng phần mềm Adobe Acrobat hoặc Nitro PDF Professional.

Muốn xem một bộ sưu tập ảnh thì cần tích hợp chương trình Windows Picture and Fax Viewer.

Muốn xem một clip video ca nhạc phải sử dụng phần mềm KMPlayer hay Windows Media Player.

(5) DSpace sử dụng Unicode là bộ phông chữ chuẩn quốc tế để trình bày nội dung tài liệu. Unicode được sử dụng để hỗ trợ chuyển đổi ngôn ngữ. Có thể tạo chỉ mục cho những ngôn ngữ khác nhau.

DSpace sử dụng bộ phông chữ tiếng Việt của Unicode trong giao diện cũng như trong sử dụng.

(6) DSpace khai thác thông tin trong những bộ sưu tập theo hai hình thức: duyệt xem thông tin và tìm tin.

DSpace có khả năng duyệt xem thông tin trong những bộ sưu tập theo bốn dấu hiệu: tác giả, nhan đề, chủ đề và năm xuất bản. Trong mỗi dấu hiệu lại có thể duyệt xem theo vần chữ cái.

Ví dụ: Duyệt xem thông tin theo nhan đề trong bộ sưu tập BÀI TẠP CHÍ của thư viện số của trường Đại học Văn hoá Hà Nội, bắt đầu bằng chữ E, ta có kết quả sau:

alt

DSpace tìm kiếm thông tin theo những trường đã được chỉ mục. Có khả năng tìm kiếm toàn văn theo từng từ (từ khoá, từ chuẩn) và đặc biệt có thể tìm theo một cụm từ trong văn bản.

Ví dụ: Trong bộ sưu tập BÀI TẠP CHÍ của thư viện số Đại học Văn hoá Hà Nội, tìm bài viết mà trong nhan đề có cụm từ “đổi mới toàn diện” ta có kết quả sau:

alt

Có hai phương thức tìm tin là:

– Tìm đơn giản, là tìm theo một từ khoá, từ chuẩn hay theo một cụm từ trong văn bản.

– Tìm tin nâng cao, là tìm với biểu thức tìm được thiết lập bằng cách liên kết những thuật ngữ tìm trong những trường bằng những toán tử logic AND, OR, NOT.

Xem thêm: Lookbook Là gì vậy? Nguồn gốc của lookbook là từ đâu?

(7) Với khả năng phân quyền mạnh, DSpace cho phép phân quyền đến từng tài khoản người sử dụng và từng bộ sưu tập. những quyền được cấu hình khá chi tiết như quyền cập nhật những tài liệu vào bộ sưu tập, quyền xem biểu ghi thư mục, và quyền xem toàn văn… Phần mềm Greenstone không cho phép thực hiện các thao tác này.

(8) Về mặt công nghệ, DSpace là một tập hợp những hợp tác ứng dụng của Java web và những chương trình tiện ích nhằm duy trì một kho siêu dữ liệu của nguồn thông tin số. DSpace là phần mềm mã nguồn mở, tất cả những mã gốc đều được viết bằng ngôn ngữ lập trình Java.

những siêu dữ liệu về tài liệu được lưu trữ trong những CSDL được xây dựng theo mô hình quan hệ và được quản lý bởi phần mềm quản trị CSDL PostgreSQL.

những ứng dụng web sử dụng phần mềm Web server và Java servlet engine (Apache và Tomcat, cả hai đều từ Apache Foundation) cung cấp giao diện để tạo lập, quản lý, lưu trữ và tìm kiếm những nguồn thông tin số. DSpace hiện hỗ trợ hai giao diện web chính là JSPUI (Java Server Page User’s Interface) và XMLUI (eXtension Markup Language User’s Interface). Tất cả những phần mềm này đều là mã nguồn mở. Nhiều phiên bản DSpace gần đây cũng hỗ trợ tìm kiếm và duyệt chức năng nhờ sử dụng server đánh chỉ mục Apache Solr.

(9) DSpace vận hành trong môi trường Internet với giao diện web, đáp ứng những yêu cầu công nghệ sau:

– Tuân theo những chuẩn công nghệ về truyền thông của mạng Internet theo mô hình Client/ Server.

– Sử dụng trình duyệt Internet Explorer hoặc FireFox.

– Phần mềm có thể được cài đặt và hoạt động trên một trong số những hệ điều hành phổ biến như Unix, Windows XP, Windows 7.

Vì DSpace là một tập hợp những ứng dụng của Java web và những chương trình tiện ích, nên việc cài đặt DSpace phải qua nhiều công đoạn.

Để cài đặt DSpace trên môi trường Windows:

– Trước hết phải cài đặt những phần mềm cần thiết.

– Tiếp theo tạo CSDL trong PostgreSQL cho DSpace.

– Sau đó mới tiến hành cài đặt DSpace vào thư mục đã được cấu hình từ trước.

những phần mềm cần thiết là:

Java SDK 6 hoặc phiên bản mới hơn, chứa những công cụ hỗ trợ sử dụng tốt nhất những chương trình, bảo đảm có những chương trình cần thiết hỗ trợ cho máy tính.

ProstgreSQL 8.x for Windows, là hệ quản trị CSDL theo mô hình quan hệ, được phát triển bởi khoa điện toán của trường Đại học Berkeley bang California, có lịch sử phát triển trên 15 năm, có nhiều ưu điểm nổi trội, được tạp chí Linux Journal Editors đánh giá là Hệ quản trị CSDL tốt nhất Hiện tại.

Apache Maven 2.x, là phần mềm quản lý việc xây dựng và lập tài liệu cho dự án, dựa trên khái niệm Project Object Model.

Apache Ant 1.7.x, là công cụ hỗ trợ đặc biệt cho lập trình bằng Java, sử dụng định dạng XML làm cơ chế hoạt động cho công cụ dưới dạng những lệnh (instructions).

Apache Tomcat 6.x, là một máy chủ web, mã nguồn mở, được phát triển bởi Apache Solfware Foundation (ASF).

Ngoài ra để chương trình có thể chạy với giao diện tiếng Việt cần file giao diện tiếng Việt sentayho.com.vnerties.

Nhiều lớp huấn luyện cài đặt và sử dụng phần mềm DSpace được mở ra trong mấy năm gần đây đã góp phần quảng bá và thúc đẩy việc sử dụng phần mềm DSpace. Nhiều thư viện những trường đại học đã sử dụng DSpace xây dựng những thư viện điện tử, quản lý và khai thác có hiệu quả những nguồn thông tin số nội sinh của mình. đó chính là tín hiệu mới của quá trình hiện đại hoá thư viện những trường đại học ở nước ta Hiện tại.

TÀI LIỆU THAM KHẢO

1. About DSpace. Truy cập từ website sentayho.com.vn/introducing.

2. DSpace, An Open Source Dynamic Digital Repository // D-Lib Magazine. – 2003. – Vol. 9. – No. 1.

3. DSpace. From Wikipedia, the free Encyclopedia. Truy cập từ sentayho.com.vn. sentayho.com.vn/wiki/DSpace.

4. DSpace on Windows. Truy cập từ sentayho.com.vn/DSPACE/DspaceOnWindows.

___________________

sentayho.com.vn. Đoàn Phan Tân

Trường Đại học Văn hoá Hà Nội

Nguồn: Tạp chí Thư viện Việt Nam. – 2015. – Số 1. – Tr. 23-28.

Tham khảo thêm: Phiên ATO Là gì vậy? cách đặt lệnh ATO trong chứng khoán? – Taichinhz

< Prev Next >

Tìm hiểu thêm: Sự khác nhau giữa proforma invoice và commercial invoice