Bộ dữ liệu hình ảnh Da liễu PAD-UFES-20
Công bố: 7 tháng 7 năm 2020
Các tổn thương da bao gồm: Carcinoma tế bào đáy (BCC), Carcinoma tế bào vảy (SCC), Dày sừng ánh sáng (ACK), Dày sừng tiết bã (SEK), Bệnh Bowen (BOD), U hắc tố ác tính (MEL), và Nốt ruồi (NEV). Vì bệnh Bowen được coi là SCC tại chỗ, chúng tôi đã gộp chúng lại, kết quả là có sáu loại tổn thương da trong tập dữ liệu, gồm ba loại ung thư da (BCC, MEL, và SCC) và ba loại bệnh da (ACK, NEV, và SEK).
Tất cả các tổn thương BCC, SCC, và MEL đều đã được chứng minh bằng sinh thiết. Những loại còn lại có thể được chẩn đoán lâm sàng theo sự đồng thuận của một nhóm bác sĩ da liễu. Tổng cộng, khoảng 58% mẫu trong tập dữ liệu này đã được chứng minh bằng sinh thiết. Thông tin này được mô tả trong siêu dữ liệu.
Các hình ảnh trong tập dữ liệu có kích thước khác nhau do được thu thập bằng các thiết bị điện thoại thông minh khác nhau. Tất cả các hình ảnh đều có sẵn ở định dạng .png.
Siêu dữ liệu liên quan đến mỗi tổn thương da bao gồm tối đa 26 đặc điểm. Tất cả các đặc điểm có sẵn trong một tài liệu CSV trong đó mỗi dòng đại diện cho một tổn thương da và mỗi cột đại diện cho một đặc điểm của siêu dữ liệu.
Tổng cộng có 1.373 bệnh nhân, 1.641 tổn thương da và 2.298 hình ảnh trong tập dữ liệu. Mỗi hình ảnh/mẫu có một tham chiếu đến bệnh nhân và tổn thương da trong siêu dữ liệu.
Số lượng mẫu: 2.298
Số lượng thuộc tính: 26
- patient_id: Mã định danh của bệnh nhân được nghiên cứu.
- lesion_id: Mã định danh của tổn thương hoặc vết thương được nghiên cứu trên bệnh nhân.
- smoke: Bệnh nhân có tiền sử hút thuốc hay không.
- drink: Bệnh nhân có tiền sử tiêu thụ rượu hay không.
- background_father: Lịch sử các bệnh hoặc tình trạng sức khỏe liên quan đến cha của bệnh nhân, bao gồm tiền sử ung thư da hoặc các bệnh khác có thể liên quan đến ung thư da.
- background_mother: Lịch sử các bệnh hoặc tình trạng sức khỏe liên quan đến mẹ của bệnh nhân, bao gồm tiền sử ung thư da hoặc các bệnh khác có thể liên quan đến ung thư da.
- age: Tuổi của bệnh nhân tại thời điểm khám.
- pesticide: Bệnh nhân có tiếp xúc với thuốc trừ sâu hoặc các hóa chất khác hay không.
- gender: Giới tính của bệnh nhân.
- skin_cancer_history: Tiền sử ung thư da trong gia đình bệnh nhân.
- cancer_history: Tiền sử ung thư trong gia đình bệnh nhân.
- has_piped_water: Địa điểm hoặc khu vực cư trú của bệnh nhân có tiếp cận nước máy hay không.
- has_sewage_system: Địa điểm hoặc khu vực cư trú của bệnh nhân có hệ thống thoát nước hợp lý hay không.
- fitzpatrick: Khả năng chịu đựng ánh sáng mặt trời của da.
- region: Khu vực cơ thể nơi tổn thương hoặc vết thương được kiểm tra.
- diameter_1: Đường kính chính của tổn thương hoặc vết thương.
- diameter_2: Đường kính thứ hai của tổn thương hoặc vết thương.
- diagnostic: Loại tổn thương hoặc vết thương được chẩn đoán.
- itch: Tổn thương hoặc vết thương có gây ngứa hay không.
- grew: Kích thước của tổn thương hoặc vết thương có lớn lên hay không.
- hurt: Tổn thương hoặc vết thương có gây đau hay không.
- changed: Hình dạng của tổn thương hoặc vết thương có thay đổi hay không.
- bleed: Tổn thương hoặc vết thương có chảy máu hay không.
- elevation: Mô tả về độ nhô của tổn thương hoặc vết thương so với bề mặt da của bệnh nhân.
- img_id: Mã định danh của hình ảnh liên quan đến tổn thương hoặc vết thương.
- biopsed: Tổn thương hoặc vết thương có được sinh thiết hay không.