Distributed Proofreaders

Distributed Proofreaders

Distributed Proofreaders (англ. Распределённые корректоры) — веб-проект по оцифровке книг для проекта «Гутенберг». Идея проекта состоит в совместной работе массы волонтёров над созданием электронных книг, начиная с этапа сканирования и заканчивая выкладкой готового текста на сайт проекта «Гутенберг».

Проект был создан в 2000 году, с тех пор усилиями его участников каталог проекта «Гутенберг» пополнился более чем 15 тысячами книг[1]. В месяц это число возрастает в среднем на 150—200 книг. Каждый день первый этап вычитки проходит более 2 тысяч страниц.

По историческим причинам сайт не поддерживает юникод, поэтому число языков, книги на которых оцифровываются в рамках проекта, сильно ограничено. По состоянию на апрель 2009 г. список языков таков:

Книги на некоторых других языках, включая славянские, обрабатываются в рамках проекта Distributed Proofreaders Europe, в котором юникод поддерживается.

Этапы создания книг

На первом этапе книги, не защищённые авторским правом[2], сканируются и проходят распознавание. Довольно значительная часть книг в проект попадает, минуя этап сканирования — из Internet Archive, Google Books и других подобных источников.

В результате распознавания получается текст, как правило, содержащий некоторое количество ошибок распознавания (англ. scannos). В связи с этим текст проходит трёхступенчатую процедуру вычитки (proofreading), в ходе которой корректор видит на экране одновременно изображение, полученное со сканера, и текущий вариант текста.

Затем книга подвергается двухступенчатому процессу форматирования, при этом, как и на предыдущем этапе, наибольший приоритет отдаётся тому, чтобы сохранить текст как можно ближе к авторскому варианту.

Отформатированный текст проходит так называемую постобработку (post-processing), а затем — окончательную верификацию. После этого книга считается готовой к выкладке на сайт проекта «Гутенберг».[3]

Примечания

  1. DP: Completed Gold E-Texts
  2. Как правило — с истёкшим сроком действия авторского права согласно законодательству США.
  3. Или на любой другой. Согласно идеологии обоих проектов, книги находятся в свободном доступе.

Ссылки


Wikimedia Foundation. 2010.

Игры ⚽ Поможем решить контрольную работу

Полезное


Смотреть что такое "Distributed Proofreaders" в других словарях:

  • Distributed Proofreaders — (commonly abbreviated as DP or PGDP) is a web based project that supports the development of e texts for Project Gutenberg by allowing many people to work together in proofreading drafts of e texts for errors …   Wikipedia

  • Distributed Proofreaders — Die Internet Site Distributed Proofreaders (DP) wurde im Jahr 2000 von Charles Franks ins Leben gerufen, um das internationale Project Gutenberg zu unterstützen. Hierbei versucht man, durch Unterteilung von eingescannten Büchern in einzelne… …   Deutsch Wikipedia

  • Distributed Proofreading — Die Internet Site Distributed Proofreaders (DP) wurde im Jahr 2000 von Charles Franks ins Leben gerufen, um das internationale Project Gutenberg zu unterstützen. Hierbei versucht man, durch Unterteilung von eingescannten Büchern in einzelne… …   Deutsch Wikipedia

  • Distributed thinking — A Distributed thinking project is similar to Distributed computing except that the human computer user performs the relevant tasks. The tasks usually being unsuitable or extremely difficult for computers but very easy for humans. Examples include …   Wikipedia

  • Project Gutenberg — Projet Gutenberg Pour les articles homonymes, voir Gutenberg. Le projet Gutenberg fut lancé par Michael Hart en 1971 afin d assurer, à ce qui deviendra plus tard Internet, une bibliothèque de versions électroniques libres (parfois appelés e… …   Wikipédia en Français

  • Project Gutenburg — Projet Gutenberg Pour les articles homonymes, voir Gutenberg. Le projet Gutenberg fut lancé par Michael Hart en 1971 afin d assurer, à ce qui deviendra plus tard Internet, une bibliothèque de versions électroniques libres (parfois appelés e… …   Wikipédia en Français

  • Projet Gutenberg — Pour les articles homonymes, voir Gutenberg. Le projet Gutenberg est une bibliothèque de versions électroniques libres (parfois appelés e texts) de livres physiquement existants. Les textes fournis sont essentiellement du domaine public, soit… …   Wikipédia en Français

  • Project Gutenberg — Infobox Library library name = Project Gutenberg library location = established = 1971 num branches = collection size = Over Num PG books annual circulation = pop served = members = budget = director = Michael S. Hart num employees = website =… …   Wikipedia

  • Gutenberg-DE — Dieser Artikel erläutert das kommerzielle deutsche Projekt Gutenberg DE, zu einem ähnlich benannten freien internationalen Projekt siehe Project Gutenberg. Das Projekt Gutenberg DE bietet deutschsprachige E Texte werbefinanziert im Internet an.… …   Deutsch Wikipedia

  • Gutenbergprojekt — Dieser Artikel erläutert das kommerzielle deutsche Projekt Gutenberg DE, zu einem ähnlich benannten freien internationalen Projekt siehe Project Gutenberg. Das Projekt Gutenberg DE bietet deutschsprachige E Texte werbefinanziert im Internet an.… …   Deutsch Wikipedia


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»