การขุดฐานข้อมูลลำดับวงศ์ตระกูลเพื่อค้นหาผู้ต้องสงสัยในคดีอาชญากรรมทำให้เกิดความกังวลเรื่องความเป็นส่วนตัว
การใช้ DNA เพื่อค้นหานักฆ่านั้นฟังดูง่าย: อัปโหลด DNA 20รับ100 ไปยังฐานข้อมูล จับคู่ และ — bingo — พบผู้ต้องสงสัย แต่ต้องใช้เครื่องมือใหม่ในการสืบหาพันธุกรรมเพื่อตามหาชายผู้ต้องสงสัยเป็น Golden State Killer
ผู้สืบสวนยืนยันว่าพวกเขาใช้ฐานข้อมูลลำดับวงศ์ตระกูลสาธารณะ GEDmatch เพื่อเชื่อมโยงหลักฐานที่เกิดเหตุกับญาติห่าง ๆ ของโจเซฟ เจมส์ เดอแองเจโล อดีตเจ้าหน้าที่ตำรวจวัย 72 ปีรายนี้ ซึ่งถูกจับกุมเมื่อวันที่ 24 เมษายน ที่บ้านของเขาในเมืองแซคราเมนโต ถูกต้องสงสัยในคดีข่มขืนประมาณ 50 ครั้งและคดีฆาตกรรม 12 ครั้งที่เกิดขึ้นระหว่างปี 1974 ถึงพฤษภาคม 1986
ข่าวดังกล่าวก่อให้เกิดความกังวลมากมายเกี่ยวกับความเป็นส่วนตัวและจริยธรรม โดยไม่มีใครบอกได้ว่ามีคนจำนวนเท่าใดในฐานข้อมูลสาธารณะที่ต้อง “หยุดและคิดหนัก” อลอนดรา เนลสัน นักสังคมวิทยาจากมหาวิทยาลัยโคลัมเบียกล่าว แต่คนอื่น ๆ บอกว่าพวกเขาสงสัยว่าตำรวจกำลังติดตามเว็บไซต์ลำดับวงศ์ตระกูลของผู้ต้องสงสัยอย่างแข็งขัน Sara Katsanis นักวิชาการด้านนโยบายพันธุศาสตร์จากโครงการริเริ่มสำหรับวิทยาศาสตร์และสังคมของ Duke University กล่าวว่าต้องใช้ทรัพยากรมากเกินไป “ฉันไม่คิดว่ามันจะกลายเป็นเรื่องธรรมดา”
ตำรวจยังไม่ได้เปิดเผยรายละเอียดวิธีการที่นำไปสู่ DeAngelo ต่อสาธารณะ ทว่าผู้เชี่ยวชาญด้านดีเอ็นเอกล่าวว่าสถานการณ์การอัปโหลดและการจับคู่แบบธรรมดาจะไม่ได้ผลในกรณีนี้ DNA ของ DeAngelo ไม่ได้อยู่ในฐานข้อมูลของตำรวจ และตัวอย่างข้อมูลที่รวบรวมจากที่เกิดเหตุไม่อยู่ในรูปแบบเดียวกับดีเอ็นเอในไซต์ลำดับวงศ์ตระกูล นอกจากนี้ บริษัททดสอบผู้บริโภคจะไม่มีส่วนร่วมในการสอบสวนทางอาญาโดยไม่มีหมายค้น แม้ว่าบริษัทจะเต็มใจช่วยเหลือ แต่ตำรวจก็ไม่มีน้ำลายหรือไม้กวาดแก้มจากผู้ต้องสงสัยที่อาจต้องสงสัยซึ่งบริษัทจำเป็นต้องทำการทดสอบ ดังนั้นผู้ตรวจสอบจึงต้องทำงานด้านพันธุกรรมอย่างมากเพื่อให้ได้ข้อมูลดีเอ็นเอและจัดรูปแบบในลักษณะที่ GEDmatch สามารถรับรู้ได้
Colleen Fitzpatrick และ Margaret Press เป็นผู้บุกเบิกวิธีการทำเช่นนั้น ทั้งคู่ได้ร่วมก่อตั้งโครงการDNA Doe ซึ่งเป็นองค์กรไม่แสวงผลกำไรที่ใช้พันธุศาสตร์และลำดับวงศ์ตระกูลเพื่อสร้างชื่อให้กับผู้ที่ไม่ปรากฏชื่อ ซึ่งรวมถึงผู้ที่ตกเป็นเหยื่ออาชญากรรม เทคนิคที่พัฒนาขึ้นสำหรับองค์กรของพวกเขาน่าจะเป็นเทคนิคเดียวกับที่ใช้ในคดี Golden State Killer Fitzpatrick และ Press กล่าว
ลายนิ้วมือทางนิติเวชในฐานข้อมูลการบังคับใช้กฎหมายประกอบด้วย 20
“การทำซ้ำแบบสั้นควบคู่” สิ่งเหล่านี้คือสถานที่ในหนังสือคำสั่งทางพันธุกรรมของมนุษย์ – จีโนม – ที่มีฐานหรือตัวอักษรสองถึงหกตัวทำซ้ำ ตัวอย่างเช่น ACGTACGTACGT จะทำซ้ำสามครั้ง ผู้คนมีจำนวนซ้ำกันในสถานที่เหล่านี้ ตำรวจใช้ “การค้นหาครอบครัว” ของฐานข้อมูลการบังคับใช้กฎหมายที่มีการทำซ้ำแบบสั้นเพื่อระบุตัวผู้ต้องสงสัยในบางกรณี แต่วิธีการดังกล่าวนำไปสู่การกล่าวหาที่ผิดพลาดในผู้อื่น
การทำซ้ำแบบสั้นหรือ STR ไม่ใช่ข้อมูล DNA ที่พบใน GEDmatch ฐานข้อมูลนั้นเป็นพื้นที่เก็บข้อมูลที่ผู้คนสามารถอัปโหลดข้อมูลพันธุกรรมดิบที่สร้างโดยบริษัททดสอบผู้บริโภค เช่น 23andMe, Ancestry, Family Tree และอื่นๆ โดยสมัครใจ ดังนั้น GEDmatch จะช่วยให้ผู้คนสามารถค้นหาญาติที่อาจใช้บริษัทอื่นเพื่อสร้างข้อมูลทางพันธุกรรม
23andMe และบริษัทอื่นๆ ใช้ตัวอย่างน้ำลายหรือไม้กวาดแก้มด้านในที่ลูกค้าส่งมาเพื่อทดสอบตัวอักษร DNA แต่ละตัวประมาณ 600,000 แบบ ที่รู้จักกันในชื่อ SNP (ออกเสียงว่า “snips”) สำหรับ single nucleotide polymorphisms “สถิติที่คุณสามารถทำได้ใน 600,000 SNP นั้นมีประสิทธิภาพมากกว่าสถิติที่คุณสามารถทำได้ใน 20 STR” Fitzpatrick กล่าว ผลที่ตามมาก็คือ การจับคู่ที่ทำผ่านการทดสอบ SNP สามารถช่วยให้ผู้ตรวจสอบระบุญาติที่อยู่ห่างไกลได้ง่ายกว่าการทำซ้ำแบบตีคู่สั้น ๆ เธอกล่าว นอกจากนี้ยังสามารถกำหนดความสัมพันธ์ระหว่างการแข่งขัน โดยแสดงให้เห็นว่าคนสองคนเป็นลูกพี่ลูกน้องที่หนึ่งหรือสาม เป็นต้น
ในการรับข้อมูลที่จำเป็นสำหรับการอัปโหลดไปยัง GEDmatch โครงการ DNA Doe และอาจเป็นผู้ตรวจสอบของ DeAngelo ใช้วิธีที่ Fitzpatrick และ Press เริ่มพัฒนาเมื่อปีที่แล้ว ทีมของพวกเขาใช้เทคนิคพิเศษในการถอดรหัสหรือจัดลำดับ DNA ที่เสื่อมโทรม สำหรับโครงการ Doe นั้นอาจหมายถึงการขุดค้นร่างกายและการแยก DNA จากกระดูก ฟัน หรือเนื้อเยื่ออื่นๆ เมื่อจัดลำดับ DNA แล้ว ผู้ตรวจสอบจะใช้โปรแกรมคอมพิวเตอร์เพื่อรวบรวมรายชื่อ SNP เดียวกันกับที่บริษัททดสอบผู้บริโภคใช้ จากนั้นไฟล์ที่เลียนแบบรูปแบบของรายงาน 23andMe หรือ Ancestry จะถูกสร้างขึ้นและอัปโหลดไปยัง GEDmatch
หากญาติของผู้ตายที่ไม่ปรากฏชื่อ (หรือในกรณีนี้คือผู้ต้องสงสัยในคดีอาญา) อยู่ในฐานข้อมูล GEDmatch ผู้สืบสวนจะสามารถเห็นการแข่งขันเหล่านั้นได้ จากนั้นการวิจัยลำดับวงศ์ตระกูลที่เพียรพยายามจะต้องเริ่มสร้างเอกลักษณ์ของบุคคล 20รับ100