哥伦比亚大学梅尔曼公共卫生学院(Columbia University Mailman School of Public Health)的 Wenpin Hou 和杜克大学医学院(Duke University School of Medicine)的 Zhicheng Ji 证明,大语言模型 GPT-4 可以在单细胞 RNA 测序分析中使用标记基因信息准确注释细胞类型。
该研究以「Assessing GPT-4 for cell type annotation in single-cell RNA-seq analysis」为题,于 2024 年 3 月 25 日发布在《Nature Methods》。详见:
一行代码就能发生信顶刊的GPTCelltype做单细胞亚群注释
import os all_markers={'cluster1':['CD3D','CD3E'], 'cluster2':['MS4A1']}
os.environ['AGI_API_KEY'] = 'sk-**'# 替换为您的实际 API 密钥 result = ov.single.gptcelltype(all_markers, tissuename='PBMC', speciename='human', model='qwen-plus', provider='qwen', topgenenumber=5) result
注意: 找到 AGI API 密钥: 返回细胞类型注释。 注意: 在进行下游分析之前,建议检查 GPT-4 返回的结果以防 AI 幻觉。
{'cluster1': '1. T cells (CD3D, CD3E)', 'cluster2': '2. B cells (MS4A1)'}
AGI_API_KEY'] = 'sk-**'# 替换为您的实际 API 密钥 result = ov.single.gptcelltype(all_markers, tissuename='PBMC', speciename='human', model='qwen-plus', provider='qwen', topgenenumber=5) result
注意: 找到 AGI API 密钥: 返回细胞类型注释。 注意: 在进行下游分析之前,建议检查 GPT-4 返回的结果以防 AI 幻觉。
new_result = {} for key in result.keys(): new_result[key] = result[key].split(': ')[-1].split(' (')[0].split('. ')[1] new_result
{'0': 'T cells', '1': 'T cells', '10': 'Platelets or Megakaryocytes', '2': 'Neutrophils', '3': 'B cells', '4': 'Cytotoxic T cells or NK cells', '5': 'Monocytes or Macrophages', '6': 'Cytotoxic T cells or NK cells', '7': 'Cytotoxic T cells', '8': 'Neutrophils', '9': 'Antigen presentation'}
OpenAI API 使用 API 密钥进行身份验证。您可以在用户或服务账户级别创建 API 密钥。服务账户绑定到一个“机器人”个体,应该用于为生产系统提供访问权限。每个 API 密钥可以被范围化到以下之一:
用户密钥 - 我们的传统密钥。提供对用户已添加的所有组织和项目的访问权限;访问 API 密钥以查看您的可用密钥。我们强烈建议转换到项目密钥以获得最佳的安全实践,尽管目前仍支持通过此方法进行访问。
请选择您需要使用的模型:支持的模型列表。
os.environ['AGI_API_KEY'] = 'sk-**'# 替换为您的实际 API 密钥 result = ov.single.gptcelltype(all_markers, tissuename='PBMC', speciename='human', model='gpt-4o', provider='openai', topgenenumber=5) result
注意: 找到 AGI API 密钥: 返回细胞类型注释。 注意: 在进行下游分析之前,建议检查 GPT-4 返回的结果以防 AI 幻觉。
{'cluster1': '1. T cell', 'cluster2': '2. B cell'}
os.environ['AGI_API_KEY'] = 'sk-**'# 替换为您的实际 API 密钥 result = ov.single.gptcelltype(all_markers, tissuename='PBMC', speciename='human', model='qwen-plus', provider='qwen', topgenenumber=5) result