Người dùng hệ thống là cá nhân độc lập hoặc cá nhân thuộc tổ chức được phân quyền bởi quản trị hệ thống. Người dùng hệ thống bao gồm các cán bộ nghiên cứu tại các Viện, Trường, các giảng viên, học viên, nghiên cứu sinh tại các cơ sở đào tạo và các cá nhân khác hoạt động trong lĩnh vực khoa học dữ liệu, trí tuệ nhân tạo, khai phá dữ liệu và học máy…
THU THẬP DỮ LIỆU
Người dùng có thể nạp (upload) trực tiếp các bộ dữ liệu qua hệ thống giao diện opensicence.vn hoặc nạp dữ liệu qua công cụ “Thu thập dữ liệu”
Công cụ thu thập dữ liệu cho phép người dùng thu thập dữ liệu từ nhiều nguồn khác nhau để lưu trữ vào nền tảng quản trị dữ liệu, bao gồm:
Dữ liệu tệp hệ thống (files system)
Dữ liệu từ các hệ quản trị cơ sở dữ liệu (RDBMS)
Dữ liệu từ các hệ thống IoT
Dữ liệu từ các hệ thống phần mềm dạng dịch vụ(SaaS)
XỬ LÝ DỮ LIỆU
Người dùng thực hiện xử lý dữ liệu trên nền tảng quản trị dữ liệu với các phương pháp: Xử lý dữ liệu theo lô (batch processing); Xử lý theo luồng (Streaming Processing)
PHÂN TÍCH DỮ LIỆU
Người dùng sử dụng phân hệ phân tích dữ liệu để thực hiện huấn luyện và thực thi các mô hình học máy, trí tuệ nhân tạo trên Nền tảng Openscience.vn.
Các bước thực hiện phân tích dữ liệu bao gồm:
QUẢN TRỊ NỀN TẢNG
Người quản trị hệ thống có vai trò quản trị giao diện Opensicence.vn, quản trị người sử dụng, quản trị dữ liệu và quản trị hạ tầng đám mây (cloud).
QUẢN TRỊ DỮ LIỆU
Quản trị dữ liệu bao gồm: quản trị kiến trúc lưu trữ nền tảng dữ liệu lớn, quản trị lưu trữ tệp (files), quản trị lưu trữ khối (blocks), quản trị lưu trữ đối tượng (Objects), quản trị cơ sở dữ liệu (RDBMS)
QUẢN TRỊ HẠ TẦNG ĐÁM MÂY
Quản trị tài nguyên Cloud: quan trắc tài nguyên, phân phối và cấp phát tài nguyên cho các máy ảo, cân bằng tải (load balancing), gán tài nguyên cho các container…
Quản trị các cụm (cluster) và các máy ảo: thiết lập, đăng ký các cụm và các máy ảo; quản trị các cụm, các máy ảo; phân phối, quản trị tài nguyên cho các cụm, máy ảo..
Kiểm soát vận hành (monitoring) và hiển thị thông tin trực quan (dashboard).