作者:Written by
2017 年,我将 DNA 样本发送给 Ancestry 以及另外两家 DNA 公司。我的父母最近去世了,我对我的家庭背景有一些疑问,我希望 DNA 能够揭示这些问题。
事实证明,DNA 的揭示引发了一个相当漫长而痛苦的故事,您可以在这里阅读:
从那时起,我就开始涉足我的家谱了。我喜欢挖掘文档和联系、跟踪线索并更新图表。
但几周前,一位 DNA 匹配者联系了我。这是一种奇怪的联系。
根据 DNA 数据,我确切地知道我们之间的关系(大致是第三代堂兄弟姐妹),大约有 1% 的 DNA 是相同的。但我不知道(现在仍然不知道)这个人的性别或名字。该联系人使用了 Ancestry 用户名,该用户名未表明性别或名字。我也知道这个人的大概年龄和我很接近,因为他们在消息中告诉了我他们的年龄。
然后事情开始变得有趣。我的表弟(因为我知道这个人是我的表弟,即使我不知道他们的名字)要求 ChatGPT 根据 DNA 数据提供对我们可能的关系的见解。这包括我们共同祖先的平均寿命以及出生和死亡时期。
还:ChatGPT 如何在几秒钟内扫描 17 万行代码,节省我的工作时间
我请求这位神秘表弟允许我告诉你他们的事聊天GPT使用,他们授予。根据他们的会议记录以及我自己的一些问题,ChatGPT 能够阐明家庭关系。
在本文中,我将向您展示如何使用 ChatGPT(以及您如何使用它)来探索 DNA 亲属之间的家谱联系。我将向您展示提示,但在大多数情况下,我只会总结响应,因为这些响应可能会很长。
我的出发点是 DNA 数据本身。据《祖传》记载:
祖先预测我们是“第二代表亲的一半被移走”,但共享的 DNA 数量并不一定能将这种关系放在家谱上。它只是告诉您一个人与另一个人相差多少次。因此,这些跳跃可以沿着树均匀地向上和向下,或者在一侧部分向上,在另一侧向下额外一代,或者两者的某种变化。
我开始向 ChatGPT 询问 DNA 数据的情况。我问:
这意味着什么?共享 DNA:10 个片段 95 cM 未加权共享 DNA:95 cM 最长片段 16 cM
另外: 我花了几个小时测试 ChatGPT 任务 - 它拒绝遵循指示有点可怕
有人告诉我,cM 是遗传连锁的测量单位。它测量两个人之间共享的 DNA 长度。95 值表示第二表兄弟姐妹或更大的兄弟姐妹。DNA 以块或片段的形式共享。细分越多,关系越密切。较大的线段表示关系较近,而较小的线段表示关系较疏远。
我们共享的 DNA 几乎没有共享片段,而且这些片段都非常小。总而言之,我们之间大约有八代人的差距。
我知道我和表弟年纪差不多,就问:
如果双方年龄相近,那么一旦被移走,他们更有可能是第三代表兄弟姐妹还是第二代表兄弟姐妹?
在这种情况下,我们更有可能是第三代表兄弟姐妹。短语“x被移除”表示代际差异。由于我们年龄相仿,所以我们的世代标签不会包括“移除”。相反,我们更有可能是第三代表兄弟姐妹。
我很难想象这一点,所以我要求 ChatGPT 给我一张图表。我的第一个提示是:“我想要一个可视化效果。请使用 DALL·E。”我回来了,无论这应该是什么。
然后我尝试说:“请使用图表而不是图片来创建可视化。”我得到了一张图表,其中在每个节点都列出了“曾曾祖父母”。
因此,我更正了 ChatGPT,“该图似乎不正确。您在每个节点上都标记了曾祖父母。”这就产生了这张图表,如果正确的话,这使得我与我表弟的关系相当清楚。我确实在其他地方寻找佐证,这似乎是正确的。
所以,现在我可以看到我们的家庭通过我的祖父母的祖父母联系在一起。这使得我们很难看到家庭联系,因为我只是暂时在整个树中确定了一位曾曾祖父母。
这让我想到了另一个问题:我和表弟共享的祖父母池中有多少个可能的祖父母?这是我问 ChatGPT 的问题:
在三表兄弟级别,曾祖父母的数量有多大?
AI 回答说,在第三代堂兄弟级别,我们每个人都有 16 个曾曾祖父母。我们有一对曾曾祖父母,这意味着我们每个人都有 15 位独一无二的曾曾祖父母。
我在整棵树中只识别出一位曾曾祖父母。我很难确认我的曾祖父母是谁(显然“罂粟”,这是我母亲提到她祖父的唯一方式,不是一个好的搜索词)。这使得我所识别的人(或者可能因为数据不稳定而可能识别出的人)是共同的曾曾祖父母的可能性相当大。
在通过 Ancestry 的消息传递界面进行的简短对话中,我的表弟将 ChatGPT 描述为“我的新最好的朋友”。他们使用 ChatGPT 试图找出我们共同的祖先可能生活在什么时候。因为我的表弟说“我们共同的祖先可能住在俄罗斯”,所以我猜我们正在使用我外祖母的树,因为她的家人来自俄罗斯。
还:编写更好的 ChatGPT 提示并更快获得您想要的结果的 7 种方法
有了上述信息,我稍微修改了我表弟的提示并将以下内容提供给 ChatGPT:
我正在尝试确定共同祖先的可能出生和死亡年份。我的表弟与我有 1% 的 DNA 相同,我们之前确定我们很可能是第三代表兄弟姐妹。我们年龄也相仿,都是20世纪60年代出生的。
我知道我外祖母的父母来自拉夫纳,大约位于俄罗斯莫斯科和圣彼得堡之间。
我外祖母的父亲于 1902 年抵达美国,当时他大约 21 岁。他的妻子于 1898 年或 1900 年抵达(取决于您相信哪个消息来源),但他们于 1905 年结婚。他们结婚时她 28 岁。那年他24岁。
我的表兄弟一家于 1880 年左右抵达。根据祖先的时代和原籍国的平均寿命,祖先的可能出生和死亡年份是多少?
人工智能将答案分为四个要素:识别共同祖先的可能世代、确定出生年份、估计死亡年份以及与迁移数据的交叉引用。在第一次运行中,ChatGPT 估计我们共同的祖先出生于 1847 年至 1861 年之间,死于 1870 年至 1921 年之间。
ChatGPT 然后问道:“您希望我通过额外的历史背景进一步完善这一点,或者探索这一估计的其他方面吗?”我回答说:“是的。”我知道,严格来说,“是”并不能回答非此即彼的问题,但我尝试过。人工智能认为这意味着我想要更多信息,这实际上是正确的选择。
另外: 最好的人工智能聊天机器人
它再次审视了家庭的时间表,考虑到了移民细节。从此,出生年份范围缩小到1835-1861年,死亡年份范围缩小到1870-1880年。
然后它问道:“您想要更多见解,例如可以进一步缩小这一范围的潜在文化或区域因素吗?”在这种情况下,我回答说:“两个家庭都是犹太人。”
ChatGPT 正确地认识到这一细节可能会改变估计,因为“19 世纪俄罗斯的犹太家庭经历了独特的人口、文化和移民模式。”那时我们的祖先生活并不容易 屠杀、强迫居住在少数民族聚居区,以及 1800 年代末俄罗斯犹太人独特的社区结构。
由此,ChatGPT 确定:
如果您想查看整个 ChatGPT 会话,请随时单击此链接。
我发现其中的一些内容非常有趣。人体大约含有200-250克DNA,大约相当于一个中等大小的苹果的重量。我和表弟共有的 DNA 量大约是其中的 1%,或者说是一个小回形针的重量。
该“回形针”由糖和磷酸基团制成,由使用两个氢键的腺嘌呤和胸腺嘧啶对以及使用三个氢键的胞嘧啶和鸟嘌呤对编码。这四个分子中的每一个都含有氮原子。
由此,我们能够发现一个我从未见过的人与我分享了一个回形针大小的代码,该代码将我们标识为两个人的后代,他们在美国内战的同时生活在俄罗斯。
我们不认识那两个人。我们不知道他们的故事。我们不知道他们的名字。然而,我们存在是因为某些东西将这两位祖先聚集在一起,过去 150 年中发生的一系列不可能且不可知的事件导致两个陌生人出生在我们曾曾祖父母居住的地球的另一边。
另外: ChatGPT 与 ChatGPT Plus:付费订阅仍然值得吗?
我们不会说他们所说的语言,我们生活的星球与他们生活的星球也有很大不同。然而,我们在这里——而你正在阅读这篇文章——完全是因为他们。
你有什么有趣的 DNA 故事吗?您是否尝试过使用 ChatGPT 作为研究您的遗产的工具?请在下面的评论中告诉我们。
您可以在社交媒体上关注我的日常项目更新。请务必订阅我的每周更新时事通讯,并在 Twitter/X 上关注我:@大卫格维茨,在 Facebook 上Facebook.com/DavidGewirtz,在 Instagram 上Instagram.com/DavidGewirtz,在蓝天上@DavidGewirtz.com,以及 YouTube 上的YouTube.com/DavidGewirtzTV。.