По своему образу и подобию
May. 16th, 2024 08:23 am![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Вчера закончил распознавание рукописного дневника, найденного в архивах Еврейского отдела Национальной библиотеки. Текст на идиш, умеренно разборчивый, - с помощью языковой модели на распознавание и правку уходит где-то по 30 минут на страницу. Автор текста, еврей из общины Бреста, рассказывает о своих лишениях во время войны. О том, как немцы выгнали всех из города, как евреям приходилось бродить от села к селу в поисках пищи и укрытия от непогоды, об отношении местных жителей, о слабых попытках членов общины соблюдать традиции. Словом, вполне ожидаемые, но оттого не менее ужасные вещи. Хотя, очевидно, автору в каком-то смысле повезло, - ему не довелось жить в гетто, перенести концлагерь и терять близких во время акций уничтожения.
Текст заканчивается, и на последней странице рукописи автор пишет сопроводительную записку:
По вашей просьбе, мол, отправляю эту рукопись руководству Еврейского научного института в Вильно сего дня, 10 мая 1939 года.
И тут я понимаю, что всё описанное касалось Первой мировой войны. И что автор только что закончил рукопись, выдохнул и отправил ее в музей. А через несколько месяцев всё это начнется для него по новой.
Загружаю этот файл в chatGPT, прошу выдать абстракт. Это часть исследования - посмотреть, сколь хорошо ИИ может делать такие абстракты для документов на идиш. Что ж, он подытоживает всё довольно адекватно, единственная ошибка - пишет, что автор описывает события времен Второй Мировой войны. Спрашиваю у него - почему ты считаешь, что Второй, а не Первой? Он отвечает: потому что написано так, как обычно люди пишут про гонения на евреев в ходе Второй, а не Первой.
Что ж, он воспринял текст так же как и я.
Для меня это наглядный пример того, как все мы при восприятии феноменов biased теми текстами, которые мы на эту тему читали и слушали ранее. Гигантское количество нарративов про Холокост совершенно затмило гонения на евреев в ПМВ. Затмило - в смысле, нам в голову не приходит воспринимать текст в этом ключе, пока нас не ткнешь носом в дату.
И мы передали такое biased восприятие явлений искусственному интеллекту.
Текст заканчивается, и на последней странице рукописи автор пишет сопроводительную записку:
По вашей просьбе, мол, отправляю эту рукопись руководству Еврейского научного института в Вильно сего дня, 10 мая 1939 года.
И тут я понимаю, что всё описанное касалось Первой мировой войны. И что автор только что закончил рукопись, выдохнул и отправил ее в музей. А через несколько месяцев всё это начнется для него по новой.
Загружаю этот файл в chatGPT, прошу выдать абстракт. Это часть исследования - посмотреть, сколь хорошо ИИ может делать такие абстракты для документов на идиш. Что ж, он подытоживает всё довольно адекватно, единственная ошибка - пишет, что автор описывает события времен Второй Мировой войны. Спрашиваю у него - почему ты считаешь, что Второй, а не Первой? Он отвечает: потому что написано так, как обычно люди пишут про гонения на евреев в ходе Второй, а не Первой.
Что ж, он воспринял текст так же как и я.
Для меня это наглядный пример того, как все мы при восприятии феноменов biased теми текстами, которые мы на эту тему читали и слушали ранее. Гигантское количество нарративов про Холокост совершенно затмило гонения на евреев в ПМВ. Затмило - в смысле, нам в голову не приходит воспринимать текст в этом ключе, пока нас не ткнешь носом в дату.
И мы передали такое biased восприятие явлений искусственному интеллекту.
no subject
Date: 2024-05-16 08:10 am (UTC)no subject
Date: 2024-05-16 09:06 am (UTC)Ого. Вот так вот и забывается. А не надо.
no subject
Date: 2024-05-16 05:31 pm (UTC)а мировую историю мы по-прежнему меряем и учим через призму восприятия событий гигантских размеров, а не длительных трендов, увы. отсюда и все косяки (включая тот прискорбный факт, что выводов мы не делаем и на ошибках прошлого плохо обучаемы)
no subject
Date: 2024-05-18 04:45 pm (UTC)