Một lịch sử chính trị đơn giản hóa của Dữ liệu lớn

Trong bách khoa toàn thư về văn hóa của cơ thể, Victoria Pitts-Taylor lần theo dấu vết phân loại chủng tộc và định lượng tiếp theo của con người đến thời kỳ khai sáng. Tuy nhiên, bà chỉ ra rằng thời kỳ dẫn đến và tiếp tục vượt ra ngoài Khai sáng không chỉ chứa đầy những khám phá, thu thập dữ liệu và định lượng. Các phân loại và phân loại của con người là một phần của quá trình chinh phục thuộc địa, cướp bóc và khuất phục. Dữ liệu được thu thập để chứng minh rằng, sự thấp kém hoặc không nhân tính của một số nhóm nhất định đã được sử dụng để biện minh cho người chinh phục bản địa ở châu Mỹ và chế độ nô lệ xuyên Đại Tây Dương. Cơ thể Đen, được phân tích thống kê, tính toán và đo màu da, được coi là không phải con người do các phân loại này, do đó, được tạo ra bởi một tập hợp dữ liệu liên quan đến các đặc điểm vật lý và / hoặc hành vi của các nhóm trong câu hỏi. Dọc theo đường cùng, ở châu Mỹ, vương miện Tây Ban Nha đã cài đặt mã hóa, một hệ thống lao động cưỡng bức cho người bản địa, theo đó một tỷ lệ nhất định dân số bản địa được giao nhiệm vụ làm nông nghiệp hoặc khai thác theo chỉ thị của những người chinh phục, trong lần lượt, trả thuế cho Crown cho dịch vụ này. Ngay từ năm 1495, Columbus đã tiến hành một cuộc điều tra dân số Taino ở Cộng hòa Dominican và Haiti ngày nay để định lượng số người bản địa được phân bổ cho Vương miện Tây Ban Nha để lao động và cống nạp.

Đơn vị phân loại dựa trên sự bành trướng của thực dân châu Âu đã đạt đến đỉnh cao vào cuối thế kỷ 18, khi nhà khoa học Thụy Điển Carl Linnaeus phân loại con người dựa trên các dấu hiệu chủng tộc và tính khí. Phân loại của ông, Systema Naturae, chia các nhóm trong năm chủng tộc chính với chủng tộc châu Âu đứng đầu trong quy mô phân loại. Công trình của ông là nền tảng cho lĩnh vực được gọi là phân biệt chủng tộc khoa học. Tác động của nó đã cảm thấy hàng thế kỷ sau đó với hiệu ứng gợn sóng vang vọng cho đến ngày nay.

Năm 1840, chính phủ Hoa Kỳ đã tiến hành một cuộc điều tra dân số tuyên bố rằng người miền Bắc, người da đen tự do bị bệnh tâm thần với tỷ lệ cao hơn so với người miền Nam, làm nô lệ. Dữ liệu này, sau này bị tranh cãi là thiếu sót và là kết quả của sự thao túng, không chỉ được sử dụng để biện minh cho chế độ nô lệ mà còn để làm câm lặng những người chống đối và bãi bỏ.

Vào thế kỷ 19, Cesare Ngànhroso, cho đến ngày nay được coi là người sáng lập tội phạm học hiện đại, đã trở thành một nhà khoa học khét tiếng với các lý thuyết về tội phạm của mình dựa trên các đặc điểm vật lý của một số nhóm nhất định. Ông đã lấy cảm hứng từ các nguyên tắc phân loại của Carl Linnaeus và tìm cách mở rộng chúng bằng cách đo kích thước hộp sọ, độ nghiêng mũi, khoảng cách mắt và vị trí tai để xác định xu hướng của một số nhóm nhất định để thực hiện tội phạm. Bộ sưu tập dữ liệu có hệ thống của anh ấy, dựa trên phương pháp giả khoa học được gọi là phrenology, khiến anh ấy kết luận rằng chỉ những người da trắng của chúng tôi mới đạt được sự đối xứng cuối cùng của hình thức cơ thể. Oliverroso dựa trên lý thuyết của mình về khuynh hướng tội phạm của những người không phải là người da trắng trên các lý thuyết sinh học của Hồi giáo về sự lệch lạc, gắn liền các biểu hiện vật lý với các hành vi cụ thể. Những lý thuyết này, được phát triển thông qua các bộ sưu tập dữ liệu và bản đồ cẩn thận của cơ thể người đã được sử dụng bởi các lực lượng cảnh sát trên khắp châu Âu và Bắc Mỹ để xác định khả năng nghi phạm phạm tội. Chúng cũng được sử dụng bởi hệ thống tư pháp hình sự để truyền các bản án cho những người được cho là có khả năng tái phạm dựa trên chủng tộc hoặc ngoại hình của họ.

Đầu thế kỷ 20, tất cả những người nhập cư vào Hoa Kỳ được yêu cầu phải vượt qua bài kiểm tra IQ trước khi được phép rời khỏi đất nước. Đổi lại, kết quả kiểm tra đã được sử dụng để tác động đến các chương trình chính sách và xã hội có lợi cho những người được coi là người da trắng vào thời điểm đó. Niềm tin rộng rãi là chỉ những người da trắng (Anglo-Saxon và Bắc Âu da trắng) mới được hưởng lợi từ các chương trình này do trí thông minh vượt trội của họ. Năm 1912, Bản tin Tâm lý học (một tạp chí khoa học vẫn còn in) đã xuất bản các nghiên cứu tâm lý học của Columbia về các dữ liệu khoa học có sẵn của Hồi giáo với kết luận về chất lượng tinh thần của Negro. Theo phân tích của dữ liệu này, thì ông Bruner tuyên bố rằng người da đen thiếu tình cảm hiếu thảo, ít có ý thức tôn kính, liêm chính hay danh dự và một danh sách dài các nghiên cứu khoa học giả định về nghiên cứu khoa học và phân tích thống kê. Gần đây như những năm 1920, Hoa Kỳ vẫn có các chương trình cho phép triệt sản các cá nhân dựa trên kết quả kiểm tra IQ. Đồng thời, ở châu Âu, các nghiên cứu khoa học của người Viking đã thể hiện sự vượt trội của các chủng tộc Bắc Âu, dựa trên các phép đo thông minh và các bộ dữ liệu kinh tế xã hội.

Thuật toán, tập dữ liệu và huyền thoại về tính khách quan

Hôm qua, The Guardian đã công bố một phân tích về cách thuật toán tìm kiếm của Google lan truyền thông tin sai lệch với xu hướng cánh hữu. Một trong những huyền thoại phổ biến nhất xung quanh công nghệ nói rằng các thuật toán và dữ liệu là các trường trung lập của Wikipedia. Cả hai sinh ra từ một số khách quan được cho là vượt qua sự thiên vị cá nhân. Vượt ra ngoài chủ quan và vào cỗ máy, như thể không có sự can thiệp của con người làm trung gian cho việc tạo ra các thuật toán, bộ dữ liệu và việc sử dụng chúng sau đó. Trong vài tuần tới, tôi dự định mở rộng các khái niệm này bằng một loạt các bài đăng sẽ tiếp tục xem dữ liệu (và quan trọng hơn là các biện pháp bảo vệ quyền riêng tư dành cho dữ liệu) không chỉ là các lĩnh vực thấm nhuần và trong sự chủ quan mà còn là công cụ can thiệp chính trị trên các nhóm bên lề. Hãy theo dõi vì mục tiêu tốt nhất và ít nhất vẫn còn đến.

Đọc Phần 2 trong loạt bài này: Internet riêng và đường phố công cộng

Đọc Phần 3 trong loạt bài này: Khảo sát, cảnh giác và huyền thoại về dữ liệu trung tính

Tôi là một nhà văn độc lập không có liên kết. Nếu bạn tìm thấy giá trị trong loại công việc tôi làm, hãy xem xét việc đóng góp. Bất kỳ khoản tiền nào, dù nhỏ đến đâu cũng sẽ cho phép tôi tiếp tục nghiên cứu và phân tích đang diễn ra này. Theo dõi tôi trên Twitter để cập nhật hàng ngày.