FPT Open Speech Dataset (FOSD) - Vietnamese

Bộ dữ liệu này bao gồm 25,921 bài phát biểu tiếng Việt đã được ghi âm (kèm theo bản ghi chép và các mốc thời gian bắt đầu và kết thúc của từng bài phát biểu) được tổng hợp thủ công từ 3 tập dữ liệu con (tổng cộng khoảng 30 giờ) do Tập đoàn FPT công bố công khai vào năm 2018.

Các bài phát biểu được lưu trữ ở định dạng *.mp3 trong khi file bản ghi chép là định dạng *.txt với mã hóa UTF-8.

FPT Corporation
Tổ chức
23/08/2024 13:45
23/08/2024 13:46
1.0
CC0: Public Domain
https://data.mendeley.com/datasets/k9sxg2twv4/4
Nguyễn Thái Nam
Viện Công nghệ Thông tin
950
82
STT Tên file dữ liệu Loại file Dung lượng Thao tác
1 k9sxg2twv4-4.part03.rar RAR 104857 KB
2 k9sxg2twv4-4.part10.rar RAR 104857 KB
3 k9sxg2twv4-4.part09.rar RAR 104857 KB
4 k9sxg2twv4-4.part11.rar RAR 104857 KB
5 k9sxg2twv4-4.part14.rar RAR 104857 KB
6 k9sxg2twv4-4.part06.rar RAR 104857 KB
7 k9sxg2twv4-4.part02.rar RAR 104857 KB
8 k9sxg2twv4-4.part15.rar RAR 104857 KB
9 k9sxg2twv4-4.part16.rar RAR 104857 KB
10 k9sxg2twv4-4.part17.rar RAR 29529 KB
11 k9sxg2twv4-4.part04.rar RAR 104857 KB
12 k9sxg2twv4-4.part01.rar RAR 104857 KB
13 k9sxg2twv4-4.part12.rar RAR 104857 KB
14 k9sxg2twv4-4.part07.rar RAR 104857 KB
15 k9sxg2twv4-4.part05.rar RAR 104857 KB
16 k9sxg2twv4-4.part08.rar RAR 104857 KB
17 k9sxg2twv4-4.part13.rar RAR 104857 KB
Image