英语轻松读发新版了,欢迎下载、更新

有家谱之谜吗?我如何使用人工智能解决家庭难题

2025-01-22 13:44:00 英文原文

作者:Written by

How I used ChatGPT to decode an Ancestry DNA mystery
中电网络

2017 年,我将 DNA 样本发送给 Ancestry 以及另外两家 DNA 公司。我的父母最近去世了,我对我的家庭背景有一些疑问,我希望 DNA 能够揭示这些问题。

事实证明,DNA 的揭示引发了一个相当漫长而痛苦的故事,您可以在这里阅读:

从那时起,我就开始涉足我的家谱了。我喜欢挖掘文档和联系、跟踪线索并更新图表。

但几周前,一位 DNA 匹配者联系了我。这是一种奇怪的联系。

根据 DNA 数据,我确切地知道我们之间的关系(大致是第三代堂兄弟姐妹),大约有 1% 的 DNA 是相同的。但我不知道(现在仍然不知道)这个人的性别或名字。该联系人使用了 Ancestry 用户名,该用户名未表明性别或名字。我也知道这个人的大概年龄和我很接近,因为他们在消息中告诉了我他们的年龄。

然后事情开始变得有趣。我的表弟(因为我知道这个人是我的表弟,即使我不知道他们的名字)要求 ChatGPT 根据 DNA 数据提供对我们可能的关系的见解。这包括我们共同祖先的平均寿命以及出生和死亡时期。

还:ChatGPT 如何在几秒钟内扫描 17 万行代码,节省我的工作时间

我请求这位神秘表弟允许我告诉你他们的事聊天GPT使用,他们授予。根据他们的会议记录以及我自己的一些问题,ChatGPT 能够阐明家庭关系。

在本文中,我将向您展示如何使用 ChatGPT(以及您如何使用它)来探索 DNA 亲属之间的家谱联系。我将向您展示提示,但在大多数情况下,我只会总结响应,因为这些响应可能会很长。

我们有什么关系?

我的出发点是 DNA 数据本身。据《祖传》记载:

  • 共享 DNA:我母亲一侧的 10 个片段均为 95 cM
  • 未加权共享 DNA:95 cM
  • 最长段:16厘米

祖先预测我们是“第二代表亲的一半被移走”,但共享的 DNA 数量并不一定能将这种关系放在家谱上。它只是告诉您一个人与另一个人相差多少次。因此,这些跳跃可以沿着树均匀地向上和向下,或者在一侧部分向上,在另一侧向下额外一代,或者两者的某种变化。

我开始向 ChatGPT 询问 DNA 数据的情况。我问:

这意味着什么?共享 DNA:10 个片段 95 cM 未加权共享 DNA:95 cM 最长片段 16 cM

另外: 我花了几个小时测试 ChatGPT 任务 - 它拒绝遵循指示有点可怕

有人告诉我,cM 是遗传连锁的测量单位。它测量两个人之间共享的 DNA 长度。95 值表示第二表兄弟姐妹或更大的兄弟姐妹。DNA 以块或片段的形式共享。细分越多,关系越密切。较大的线段表示关系较近,而较小的线段表示关系较疏远。

我们共享的 DNA 几乎没有共享片段,而且这些片段都非常小。总而言之,我们之间大约有八代人的差距。

什么样的表兄弟?

我知道我和表弟年纪差不多,就问:

如果双方年龄相近,那么一旦被移走,他们更有可能是第三代表兄弟姐妹还是第二代表兄弟姐妹?

在这种情况下,我们更有可能是第三代表兄弟姐妹。短语“x被移除”表示代际差异。由于我们年龄相仿,所以我们的世代标签不会包括“移除”。相反,我们更有可能是第三代表兄弟姐妹。

给我画个图

我很难想象这一点,所以我要求 ChatGPT 给我一张图表。我的第一个提示是:“我想要一个可视化效果。请使用 DALL·E。”我回来了,无论这应该是什么。

image
David Gewirtz/ZDNET 截图

然后我尝试说:“请使用图表而不是图片来创建可视化。”我得到了一张图表,其中在每个节点都列出了“曾曾祖父母”。

因此,我更正了 ChatGPT,“该图似乎不正确。您在每个节点上都标记了曾祖父母。”这就产生了这张图表,如果正确的话,这使得我与我表弟的关系相当清楚。我确实在其他地方寻找佐证,这似乎是正确的。

corrected-family-tree-third-cousins-connection.png
David Gewirtz/ZDNET 截图

所以,现在我可以看到我们的家庭通过我的祖父母的祖父母联系在一起。这使得我们很难看到家庭联系,因为我只是暂时在整个树中确定了一位曾曾祖父母。

爷爷奶奶有几个?

这让我想到了另一个问题:我和表弟共享的祖父母池中有多少个可能的祖父母?这是我问 ChatGPT 的问题:

在三表兄弟级别,曾祖父母的数量有多大?

AI 回答说,在第三代堂兄弟级别,我们每个人都有 16 个曾曾祖父母。我们有一对曾曾祖父母,这意味着我们每个人都有 15 位独一无二的曾曾祖父母。

另外: 最好的人工智能编码(以及不该使用的)

我在整棵树中只识别出一位曾曾祖父母。我很难确认我的曾祖父母是谁(显然“罂粟”,这是我母亲提到她祖父的唯一方式,不是一个好的搜索词)。这使得我所识别的人(或者可能因为数据不稳定而可能识别出的人)是共同的曾曾祖父母的可能性相当大。

代际问题

在通过 Ancestry 的消息传递界面进行的简短对话中,我的表弟将 ChatGPT 描述为“我的新最好的朋友”。他们使用 ChatGPT 试图找出我们共同的祖先可能生活在什么时候。因为我的表弟说“我们共同的祖先可能住在俄罗斯”,所以我猜我们正在使用我外祖母的树,因为她的家人来自俄罗斯。

还:编写更好的 ChatGPT 提示并更快获得您想要的结果的 7 种方法

有了上述信息,我稍微修改了我表弟的提示并将以下内容提供给 ChatGPT:

我正在尝试确定共同祖先的可能出生和死亡年份。我的表弟与我有 1% 的 DNA 相同,我们之前确定我们很可能是第三代表兄弟姐妹。我们年龄也相仿,都是20世纪60年代出生的。

我知道我外祖母的父母来自拉夫纳,大约位于俄罗斯莫斯科和圣彼得堡之间。

我外祖母的父亲于 1902 年抵达美国,当时他大约 21 岁。他的妻子于 1898 年或 1900 年抵达(取决于您相信哪个消息来源),但他们于 1905 年结婚。他们结婚时她 28 岁。那年他24岁。

我的表兄弟一家于 1880 年左右抵达。根据祖先的时代和原籍国的平均寿命,祖先的可能出生和死亡年份是多少?

人工智能将答案分为四个要素:识别共同祖先的可能世代、确定出生年份、估计死亡年份以及与迁移数据的交叉引用。在第一次运行中,ChatGPT 估计我们共同的祖先出生于 1847 年至 1861 年之间,死于 1870 年至 1921 年之间。

ChatGPT 然后问道:“您希望我通过额外的历史背景进一步完善这一点,或者探索这一估计的其他方面吗?”我回答说:“是的。”我知道,严格来说,“是”并不能回答非此即彼的问题,但我尝试过。人工智能认为这意味着我想要更多信息,这实际上是正确的选择。

另外: 最好的人工智能聊天机器人

它再次审视了家庭的时间表,考虑到了移民细节。从此,出生年份范围缩小到1835-1861年,死亡年份范围缩小到1870-1880年。

然后它问道:“您想要更多见解,例如可以进一步缩小这一范围的潜在文化或区域因素吗?”在这种情况下,我回答说:“两个家庭都是犹太人。”

ChatGPT 正确地认识到这一细节可能会改变估计,因为“19 世纪俄罗斯的犹太家庭经历了独特的人口、文化和移民模式。”那时我们的祖先生活并不容易 屠杀、强迫居住在少数民族聚居区,以及 1800 年代末俄罗斯犹太人独特的社区结构。

由此,ChatGPT 确定:

  • 出生年份范围:~1820 年至 1840 年(取决于世代时间)。
  • 死亡年份范围:~1870 年 – 1900 年(如果他们在孩子移民之前或期间去世,可能更接近~1880 年)。

如果您想查看整个 ChatGPT 会话,请随时单击此链接

DNA连接

我发现其中的一些内容非常有趣。人体大约含有200-250克DNA,大约相当于一个中等大小的苹果的重量。我和表弟共有的 DNA 量大约是其中的 1%,或者说是一个小回形针的重量。

还:人们在提示人工智能时犯的五个最大错误

该“回形针”由糖和磷酸基团制成,由使用两个氢键的腺嘌呤和胸腺嘧啶对以及使用三个氢键的胞嘧啶和鸟嘌呤对编码。这四个分子中的每一个都含有氮原子。

由此,我们能够发现一个我从未见过的人与我分享了一个回形针大小的代码,该代码将我们标识为两个人的后代,他们在美国内战的同时生活在俄罗斯。

我们不认识那两个人。我们不知道他们的故事。我们不知道他们的名字。然而,我们存在是因为某些东西将这两位祖先聚集在一起,过去 150 年中发生的一系列不可能且不可知的事件导致两个陌生人出生在我们曾曾祖父母居住的地球的另一边。

另外: ChatGPT 与 ChatGPT Plus:付费订阅仍然值得吗?

我们不会说他们所说的语言,我们生活的星球与他们生活的星球也有很大不同。然而,我们在这里——而你正在阅读这篇文章——完全是因为他们。

你有什么有趣的 DNA 故事吗?您是否尝试过使用 ChatGPT 作为研究您的遗产的工具?请在下面的评论中告诉我们。


您可以在社交媒体上关注我的日常项目更新。请务必订阅我的每周更新时事通讯,并在 Twitter/X 上关注我:@大卫格维茨,在 Facebook 上Facebook.com/DavidGewirtz,在 Instagram 上Instagram.com/DavidGewirtz,在蓝天上@DavidGewirtz.com,以及 YouTube 上的YouTube.com/DavidGewirtzTV。.

关于《有家谱之谜吗?我如何使用人工智能解决家庭难题》的评论


暂无评论

发表评论

摘要

使用 ChatGPT 等 AI 工具探索您与表亲的 DNA 联系并深入研究历史背景确实很有趣!以下是您旅程中的一些重要收获:1. **确定关系**:- 您确定你们的 DNA 大约有 1% 相同,表明存在第三表亲关系。- 你们年龄相近(都出生于 1960 年代),并且都有来自俄罗斯拉夫纳的共同血统,这有助于缩小历史时间线。2. **估算祖先出生和死亡年份**:- 根据那个时代的迁徙模式和平均寿命,您的祖先可能生活在 1847-1861 年(出生年份)和 1870-1921 年(死亡年份)之间。- 根据历史背景进一步细化,将出生年份的范围缩小到 ~1835-1861,死亡年份的范围缩小到 ~1870-1880。- 考虑到影响 19 世纪俄罗斯犹太家庭的独特文化和人口因素,估计范围变得更加具体:~1820-1840(出生年份)和~1870-1900(死亡年份)。3. **了解 DNA 连接**:- 共享DNA大约相当于一个小回形针的重量。- 这种联系凸显了导致你和你表弟存在的错综复杂的事件网络,尽管他们生活在不同的大陆。4. **历史背景**:- 您的祖先生活在俄罗斯历史上的动荡时期,包括大屠杀和对犹太人强制居住限制的时期。- 他们面临的挑战影响了他们在 20 世纪初移民美国的决定。5. **对祖先的反思**:- 虽然您不知道祖先的生活或名字的具体细节,但了解他们的历史背景可以让您深入了解更广泛的移民和文化生存故事。- 人类历史的相互联系在远亲之间共享的 DNA 中显而易见。使用 ChatGPT 研究遗产提供了一种通过历史数据探索深层个人联系的强大方法。如果您对家人的过去有更多疑问或需要进一步完善,ChatGPT 等人工智能工具可能是宝贵的资源。您想分享您研究中的任何其他见解或故事吗?