Appropedia:Using images in the public domain/Searching Gutenberg.org/ru
Gutenberg будет временно удален из поиска в открытом доступе Appropedia до тех пор, пока не будет создан отдельный фильтрованный поиск как один из компонентов поиска в открытом доступе.
Более подробно причины:
- В нем не так много общедоступного контента, имеющего отношение к Appropedia, и
- Найти контент, являющийся общественным достоянием, на Гутенберге оказалось сложнее, чем ожидалось. Когда я просматривал результаты поиска, многие из них были отмечены как защищенные авторским правом. Однако на странице об авторских правах указано, что большая часть контента является общественным достоянием. В любом случае, потребуется специальный фильтрованный поиск. Любая помощь приветствуется (отредактируйте эту страницу, добавьте информацию/предложения здесь или на странице обсуждения, или свяжитесь с Chriswaterguy на его странице обсуждения ).
Сначала будет предпринята попытка отфильтрованного поиска с использованием обычного поиска Google по термину site:gutenberg.org , а как только мы разработаем правильный фильтр, мы найдем способ интегрировать его в APDS .
Первые попытки фильтрованного поиска
Примечание: эта попытка не удалась, поскольку фильтрация производилась по терминам, найденным на странице ссылки, а не в самом документе.
- Смешанные результаты по отфильтрованному поиску: Поиск в Google по запросу site:gutenberg.org "является произведением общественного достояния" дает 2100 результатов. (Большие числа можно найти только после нажатия кнопки "повторить поиск с включением пропущенных результатов" внизу, но это не должно быть проблемой в окончательной поисковой системе, так как к каждому поиску будет добавлен другой текст.) Поиск по запросу site:gutenberg.org "не защищено авторским правом в Соединенных Штатах" дает 11 000 результатов. Поиск по любой из фраз, site:gutenberg.org "не защищено авторским правом в Соединенных Штатах" ИЛИ "является произведением общественного достояния" , дает 11 500 результатов. Цифры, похоже, меняются изо дня в день - указывает ли это на проблему с тщательностью индексации? Насколько полны эти поиски? и какой из них наиболее полный?
- Пробовал использовать ключевые слова поисковой системы: (Панель управления пользовательской поисковой системы Google -> Основы). Использование -(site:gutenberg.org "Проверить лицензию") не сработало. Например, поиск по запросу "несколько буйных моряков" (текст PD найден здесь ) не дал результатов. Использование этого, казалось, нарушило поиск - не было найдено результатов даже для базового поиска, такого как вода или фильтр - но когда это было реализовано повторно, это, похоже, снова сработало. Это было странно, но в любом случае это не дало желаемых результатов, поэтому ключевые слова были удалены, поле осталось пустым.
Проблема : Причина, по которой они не сработали, определена. Поиск в Google фразы, найденной в документе, являющемся общественным достоянием, например, site:gutenberg.org "несколько буйных моряков" , работает (если только фраза не слишком длинная по какой-то причине). Однако с фильтром это не работает, например, site:gutenberg.org "является произведением, являющимся общественным достоянием" "несколько буйных моряков" , поскольку фильтр работает с текстом, найденным на странице ссылки, а не с самим документом. Поиск в Yahoo имеет ту же проблему. Это осознание переводит нас на следующий этап...
Следующие попытки: поиск текстов документов
Мы хотим фразу из фактического текста документов общественного достояния , и эта фраза может быть зарыта в многословных утверждениях в текстовых файлах. У этих файлов есть только лицензия boilerplate? Какая конкретная фраза используется на страницах документов общественного достояния Гутенберга, и только на страницах общественного достояния?
Вот где прогресс застопорился — у меня нет времени работать над этим аспектом поиска в ближайшие несколько месяцев, так как это не является приоритетом для того типа контента, который нужен Appropedia. -- Chriswaterguy · talk 22:29, 10 февраля 2008 (PST)
Смотрите также
- Возможно, стоит обратить внимание на поиск электронных книг проекта Gutenberg с помощью Anacleto, но у него нет опции общественного достояния .