MIMIC-III 数据库使用指南(一)
MIMIC-III数据库使用指南(一)
Overview of MIMIC-III
MIMIC III[1]是一个可以免费访问的重症护理数据库。由MIT Lab for Computational Physiology开发的一个公开可用的数据集,包含约60000例重症监护病房入院病人相关的确定的健康数据,包括人口统计、生命体征、实验室检测、药物治疗等等。
MIMIC-III 数据库下载
- 在申请使用MIMIC数据库之前,需要完成一个小测试(Data or Specimens Only Research)
- 首先在CITI program网站上注册,选择“Massachusetts Institute of Technology Affiliates”作为您的affiliation(不是“independent learner”)
- 单击链接以添加“Massachusetts Institute of Technology Affiliates course”。在“ Human Subjects training category”培训类别中,选择“Data or Specimens Only Research”课程
- 完成课程并保存完成报告的副本。完成报告列出了所有已完成的模块,以及日期和分数。
- 访问MIMIC-III
- 在Physionet上注册账号并登录:https://physionet.org
- 前往项目链接:https://physionet.org/content/mimiciii/
- 在项目说明中找到“Files”部分
- 单击“credentialed user”链接,然后按照说明提交您的应用程序以进行凭据访问。请记住提供您的CITI完成报告(即1中最后一点的报告)
- 批准后,您将收到一封电子邮件,其中包含有关从PhysioNetWorks下载数据库的说明。批准可能需要几个工作日,如果您的要求缺少任何必填信息,批准将被延迟。(一定要保证提交信息的完整性、准确性)
- 如果是学生或者博后,需要在“reference”中填上你*导师的姓名和联系方式。如果列出的信息没有在组织网站的目录或其他易于查找的页面中,请提供主管或同事等推荐人的姓名和联系信息。不要列出自己作为参考。
- *确保从CITI“仅数据或标本研究”培训计划中上传完成报告(PDF或图像文件)。完成报告列出了所有已完成的模块,以及日期和分数。如果您想提交多页,请将它们合并为一个pdf文件。
- 下载MIMIC-III
- 再取得资格后进行下载,下载链接:https://physionet.org/content/mimiciii/
- 文件较大(50G+),建议存储在有较大空间的硬盘中,推荐存储在SSD等写入和读取较快的硬盘中,方便之后使用。
- MIMIC-III demo
- 由于数据库本体过大,官方还提供了demo方便使用者熟悉操作,编写demo代码。下载链接:https://physionet.org/content/mimiciii-demo/
MIMIC-III 导入 PostgreSQL
- 由于数据库本体过大,官方还提供了demo方便使用者熟悉操作,编写demo代码。下载链接:https://physionet.org/content/mimiciii-demo/
- PostgreSQL下载
- PostgreSQL是世界知名的开源数据库软件。下载链接(包含Linux/MacOS/Windows):https://www.postgresql.org/download/
- PostgreSQL安装与简单操作
- 导入MIMIC-III
- 简单使用
MIMIC-III 重要的表
- MIMIC官网关于表的简述
- 中文翻译版
MIMIC-III 查询实例
- select
1
2
3
4
5
6查询ADMISSIONS表中的所有列
select * from admissions;
DISTINCT函数
select distinct(gender) from patients;
COUNT函数
select gender,count(gender) as gender_count from patients group by gender; - link
1
2
3
4
5
6
7
8INNER JOIN内连接
select pa.subject_id, pa.gender, pre.drug from patients pa inner join prescriptions pre on pa.subject_id=pre.subject_id
group by pa.subject_id, pa.gender, pre.drug
order by pa.subject_id asc;
LEFT JOIN外连接(LEFT JOIN 关键字会从左表 (table_name1) 那里返回所有的行,即使在右表 (table_name2) 中没有匹配的行。)
select pa.subject_id, pa.gender, pre.drug from patients pa left join prescriptions pre on pa.subject_id=pre.subject_id
group by pa.subject_id, pa.gender, pre.drug
order by pa.subject_id asc;其它
[1] MIMIC-III, a freely accessible critical care database. Johnson AEW, Pollard TJ, Shen L, Lehman L, Feng M, Ghassemi M, Moody B, Szolovits P, Celi LA, and Mark RG. Scientific Data (2016). DOI: 10.1038/sdata.2016.35. Available at: http://www.nature.com/articles/sdata201635
Deadline: 2021.3.15
本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!