Commons:Машиночитаемые данные - Wikimedia Commons
Article Images
Other languages:
На Викискладе многие метаданные (включая лицензию и автора) не доступны в машиночитаемой форме. Существует API-модуль iiprop=extmetadata, который может быть использован для получения некоторых значений (пример), но так как информация введена в свободной текстовой форме на самой странице описания файла, это не идеальный вариант. Проводимый проект Структурированные данные на Викискладе направлен на перемещение метаданных в виде полностью структурированных данных и в конечном итоге заменит машиночитаемые данные, представленные на этой странице.
Тем временем, чтобы облегчить переход к более структурированным данным в будущем, Викисклад использует набор стандартных шаблонов, которые были сделаны машиночитаемыми определённым образом, через HTML-элементы. Некоторые скрипты уже используют это. Стоит отметить, что эти данные доступны для любой вики, использующей Викисклад, где они могут быть прочитаны из HTML страницы «File:», как и другие локальные данные.
Машиночитаемые данные, задаваемые информационными шаблонами-карточками
Есть несколько стандартных шаблонов-инфобоксов, помечающих различные элементы шаблона различными тегами, что позволяет парсинг информации. Используются несколько различных стилей тегов:
- Метки микроформатов следуют индустриальным стандартам и могут быть разобраны уже существующими инструментами.
- Атрибуты id (идентификаторы) тега <td> являются пользовательской разметкой, которая позволяет задавать более полные теги, которые могут быть прочитаны пользовательскими инструментами. Наиболее универсальные инфобоксы имеют двухстолбцовую структуру: столбец № 1 содержит имя поля, а столбец № 2 значение
- Традиционно атрибуты id (идентификаторы) тега <td> использовались для отметки имени, данного ячейке в первом столбце строки. Для получения данных вам нужно будет получить содержимое следующей ячейки
<td>
во втором столбце. - Шаблоны {{Creator}} и {{Institution}} имеют более сложную структуру, поэтому ячейки с фактическими данными помечены
атрибутами пурпурного цвета
.
- Традиционно атрибуты id (идентификаторы) тега <td> использовались для отметки имени, данного ячейке в первом столбце строки. Для получения данных вам нужно будет получить содержимое следующей ячейки
Шаблон | Название параметра шаблона | Описание | Атрибут id у <td> | Микроформат | Комментарий |
---|---|---|---|---|---|
{{Information}} | description | описание файла | fileinfotpl_desc |
hProduct.description. | Часто содержит несколько языков, оформленных шаблоном {{Lang}}. |
{{Information}} | date | дата создания оригинальной работы | fileinfotpl_date |
hCalendar vevent.dtstart | Иногда дополнительно содержит дату публикации или содержит только ее. Эти две даты имеют разное значение для защиты прав. Если используется {{Date context}}, может показать разницу. Микроформат, добавленный шаблоном {{Date}} |
{{Information}} | source | источник файла | fileinfotpl_src |
Часто содержит целые таблицы. Пока что у нас нет хороших способов обращения с этими шаблонами источников. Шаблоны источников часто содержат идентификаторы каталогов, но и они не машиночитаемы. | |
{{Information}} | author | автор файла | fileinfotpl_aut |
Это может быть автор, создатель и/или обладатель авторских прав и используется по-разному. Часто содержит шаблон {{Creator}}, описание которого приведено ниже. | |
{{Information}} | permission | разрешение/лицензия для файла | fileinfotpl_perm |
||
{{Information}} | other versions | другие версии файла | fileinfotpl_ver |
||
{{Artwork}} | description | описание художественного произведения | fileinfotpl_desc |
hProduct.description | |
{{Artwork}} | date | дата создания оригинала художественного произведения | fileinfotpl_date |
hCalendar vevent.dtstart | микроформат, добавленный шаблоном {{Date}} |
{{Artwork}} | source | источник файла | fileinfotpl_src |
||
{{Artwork}} | artist | создатель художественного произведения | fileinfotpl_aut |
"hProduct.fn value" | |
{{Artwork}} | author | автор произведения | fileinfotpl_aut |
"hProduct.fn value" | |
{{Artwork}} | permission | разрешение/лицензия для файла и художественного произведения | fileinfotpl_perm |
||
{{Artwork}} | other versions | другие версии файла | fileinfotpl_ver |
||
{{Artwork}} | title | заголовок художественного произведения | fileinfotpl_art_title |
hProduct.fn | |
{{Artwork}} | object type | тип объекта художественного произведения | fileinfotpl_art_object_type |
||
{{Artwork}} | medium | техника или способ создания художественного произведения | fileinfotpl_art_medium |
||
{{Artwork}} | dimensions | размеры художественного произведения | fileinfotpl_art_dimensions |
||
{{Artwork}} | gallery | учреждение, в котором хранится художественное произведение | fileinfotpl_art_gallery |
||
{{Artwork}} | location | местоположение художественного произведения внутри учреждения | fileinfotpl_art_location |
hProduct.locality | |
{{Artwork}} | accession number | Инвентарный номер художественного произведения | fileinfotpl_art_id |
hProduct.identifier | |
{{Artwork}} | object history | история объекта художественного произведения | fileinfotpl_art_object_history |
||
{{Artwork}} | exhibition history | история выставок художественного произведения | fileinfotpl_art_exhibition_history |
||
{{Artwork}} | credit line | создатель художественного произведения | fileinfotpl_art_credit_line |
||
{{Artwork}} | inscriptions | краткое посвящение художественного произведения | fileinfotpl_art_inscriptions |
||
{{Artwork}} | notes | заметки о художественном произведении | fileinfotpl_art_notes |
||
{{Artwork}} | references | ссылки, связанные с художественным произведением | fileinfotpl_art_references |
||
{{Book}} | Author | автор книги | fileinfotpl_author |
||
{{Book}} | Editor | редактор книги | fileinfotpl_book_editor |
||
{{Book}} | Translator | переводчик книги | fileinfotpl_book_translator |
||
{{Book}} | Illustrator | иллюстратор книги | fileinfotpl_book_illustrator |
||
{{Book}} | Title | заголовок книги | fileinfotpl_book_title |
||
{{Book}} | Subtitle | подзаголовок книги | fileinfotpl_book_subtitle |
||
{{Book}} | Series title | название серии книг | fileinfotpl_book_series-title |
||
{{Book}} | Authority file | данные нормативного контроля | fileinfotpl_book_authority |
||
{{Book}} | Publisher | издатель книги | fileinfotpl_book_publisher |
||
{{Book}} | Printer | печатник книги | fileinfotpl_book_printer |
||
{{Book}} | Year of publication | дата или год публикации книги | fileinfotpl_date |
||
{{Book}} | Place of publication | место или город публикации книги | fileinfotpl_book_place-of-publication |
||
{{Book}} | Language | язык книги | fileinfotpl_book_language |
||
{{Book}} | Description | описание книги | fileinfotpl_desc |
||
{{Creator}} | Name | имя создателя | creator |
vCard.fn | |
{{Creator}} | Alternative names | другие имена создателя | fileinfotpl_creator_alt-name_value |
vCard.nickname | |
{{Creator}} | Description | национальность и профессия(и) создателя | fileinfotpl_creator_desc_value |
vCard.note | |
{{Creator}} | Date of death | дата смерти создателя | fileinfotpl_creator_deathdate_value |
||
{{Creator}} | Date of birth | дата рождения создателя | fileinfotpl_creator_birthdate_value |
vCard.bday | |
{{Creator}} | Location of birth/death | место смерти создателя | fileinfotpl_creator_deathloc_value |
||
{{Creator}} | Location of birth | место рождения создателя | fileinfotpl_creator_birthloc_value |
||
{{Creator}} | Work period | период активности создателя | fileinfotpl_creator_work-period_value |
||
{{Creator}} | Work location | место работы создателя | fileinfotpl_creator_work-location_valuev |
||
{{Creator}} | Image | портрет или фото, изображающие создателя | fileinfotpl_creator_image |
||
{{Creator}} | Authority file | авторитетный контроль, связанный с создателем | fileinfotpl_creator_authority_value |
||
{{FileContentsByBot}} | (различные) | по-разному, пожалуйста, обсуждайте шаблон {{FileContentsByBot}} | (various) |
hproduct-by-bot | большой набор данных, который продолжает расти, обсуждайте шаблон {{FileContentsByBot}} |
{{Photograph}} | title | название фотографии | fileinfotpl_art_title |
hProduct.fn | |
{{Photograph}} | description | описание фотографии | fileinfotpl_desc |
hProduct.description | |
{{Photograph}} | original description | первоначальное описание фотографии в архиве | fileinfotpl_desc |
hProduct.description | |
{{Photograph}} | date | дата создания оригинала произведения | fileinfotpl_date |
hCalendar vevent.dtstart | микроформат, добавленный шаблоном {{Date}} |
{{Photograph}} | medium | техника или материал фотографии | fileinfotpl_art_medium |
||
{{Photograph}} | dimensions | размеры фотографии | fileinfotpl_art_dimensions |
||
{{Photograph}} | artist | создатель фотографии | fileinfotpl_aut |
"hProduct.fn value" | |
{{Photograph}} | institution | учреждение, в котором хранится художественное произведение | fileinfotpl_art_gallery |
||
{{Photograph}} | location | местонахождение художественного произведения внутри учреждения | fileinfotpl_art_location |
hProduct.locality | |
{{Photograph}} | source | источник файла | fileinfotpl_src |
||
{{Photograph}} | permission | разрешение/лицензия для файла и художественного произведения | fileinfotpl_perm |
||
{{Photograph}} | other versions | другие версии файла | fileinfotpl_ver |
||
{{Photograph}} | accession number | номер, по которому доступна фотография | hProduct.identifier |
Другой возможный формат метаданных Commons
Из-за того, что формат таблица+идентификатор очень сложно добавлять в шаблоны, отличающиеся по формату от шаблона Информация в Commons, в качестве другого возможного формата можно использовать CommonsMetadata, похожий на шаблоны лицензий: весь информационный шаблон должен заключаться в класс fileinfotpl
, а тег, содержащий конкретную информацию, должен иметь класс fileinfotpl_*
(с такими же именами, как и выше, но для классов, а не для идентификаторов).
Машиночитаемые данные, задаваемые шаблонами лицензий
Появилось в октябре 2010 года с использованием классов <span class="licensetpl_XXX">
licensetpl
- Элемент, идентифицирующий лицензию. Служит «обёрткой» для всего кода лицензии, должен быть ЕДИНСТВЕННОЙ лицензией, а не мульти-лицензией.
licensetpl_short
- Короткое название лицензии: «Public domain», «CC BY-SA 3.0», «CC by 2.0 fr» и т. п.
licensetpl_long
- Длинное название лицензии: «Public domain», «Creative Commons Attribution-Share Alike 3.0».
licensetpl_attr_req
- Требуется ли атрибуция: «true» (истина) или «false» (ложь).
licensetpl_attr
- Требуемая атрибуция: текст в свободной форме.
licensetpl_link_req
- Требуется ли для этой лицензии ссылка на лицензию: «true» или «false».
licensetpl_link
- Ссылка на документ лицензии: «www.creativecommons.org/licenses/by-sa/XXX/YYY»
licensetpl_nonfree
- «true», если это несвободная лицензия (не используется на Викискладе, только для вики-проектов с ПДИ)
Несколько блоков licensetpl
для одного произведения могут быть заключены в общий блок, имеющий класс licensetpl_wrapper
.
Шаблоны, задающие эту информацию
- Настройка шаблонов
licensetpl
включает: {{PD-Layout}}, {{Cc-by-sa-3.0-migrated}}, {{Cc-by-layout}}, {{Cc-by-sa-layout}}, {{Cc-zero}}, {{FAL}}, {{GFDL}}, {{GFDL-1.2}}, {{GPL}} и {{LGPL}}.
Машиночитаемые данные, задаваемые шаблонами форматирования
Шаблоны форматирования стилей, созданные для единого оформления различных семейств шаблонов, не связанных с лицензией, содержат машиночитаемые данные, позволяющие идентифицировать эти данные.
Шаблон | Назначение | название класса |
---|---|---|
{{Restriction-Layout}} | используется в сообщениях с предупреждениями | restrictiontemplate
|
{{FoP-Layout}} | используется шаблонами, касающимися свободы панорамы | foptemplate
|
{{Partnership-Layout}} | используется шаблонами об организациях-партнёрах | partnershiptemplate
|
{{Source-Layout}} | используется общими шаблонами источников | sourcetemplate
|
{{Created with}} | используется шаблонами «Создано с помощью…» | createdwithtemplate
|
Машиночитаемые данные, задаваемые шаблонами, не касающимися охраны авторских прав
Шаблоны, описывающие правовые ограничения, не связанные с авторскими правами, содержат эти классы, чтобы идентифицировать специфичные шаблоны ограничений.
Шаблон(ы) | Цель | название класса |
---|---|---|
{{Trademarked}} | Изображения с торговой маркой | restriction-trademarked
|
{{Copydesign}} | Дизайн, на который действуют авторские права. | restriction-design
|
{{Communist symbol}} | Коммунистические символы | restriction-communist
|
{{Italy-MiBAC-disclaimer}} {{Soprintendenza}} | Репродукции итальянских произведений | restriction-ita-mibac
|
{{Australian Commonwealth reserve}} | Заповедники Австралии | restriction-aus-reserve
|
{{Personality rights}} {{Romania personality rights}} | Права личности | restriction-personality
|
{{2257}} | Сообщение, связанное с Актом по защите детей и борьбе с непристойностью (США) | restriction-2257
|
{{Costume}} | Костюмы | restriction-costume
|
{{Fan art}} | Фан-арт | restriction-fan-art
|
{{Currency}} | Валюта | restriction-currency
|
{{IHL Symbol}} | Cимволы, использование которых регулируется Международным гуманитарным правом. | restriction-ihl
|
{{Nazi symbol}} | Нацистские и фашистские символы | restriction-nazi
|
{{Insignia}} | Официальные знаки отличия | restriction-insignia
|
Машиночитаемые данные, задаваемые особыми шаблонами
Задаются и другие машиночитаемые данные. Некоторые из них приведены ниже:
- {{Personality rights}}
<span class="commons-template-name" style="display:none" id="commons-template-personality-rights">Personality rights</span>
- {{Credit line}}
<td id="fileinfotpl_credit" class="fileinfo-paramfield fileinfotpl_credit" style=""></td>
Машиночитаемые данные, задаваемые шаблонами местоположения
{{Location}} и подобные шаблоны добавляют машиночитаемые данные георасположения в следующем формате: <span class="geo">12.34;24.68</span>
(широта и долгота как числа с плавающей запятой, разделённые точкой с запятой). Координаты используют систему WGS 84 (ту же, которую использует GPS и большинство онлайн-карт). Более подробную информацию смотрите на странице Викисклад:Geocoding.
MediaWiki API
Сейчас MediaWiki API обслуживает ограниченное количество метаданных. Рассмотрим следующий запрос:
(Открыть в API-песочнице) который возвращает некоторые полезные параметры, такие как Credit, Artist, LicenseUrl и Copyrighted и используется, например, виджетом Media Viewer.
Скрипты, использующие машиночитаемые данные
- Category:Templates generating microformats
- Commons:WikiProject Microformats
- Category:Files with lack of machine-readability
- Экспериментальные, прекращенные проекты: Commons:API, Commons:Commons API
- Когда возможно, заключайте "настоящие" данные, а не заголовок поля. Этот последний метод раньше использовался для всех наших информационных шаблонов, но его значительно сложнее поддерживать при длительном выполнении.
- Заключайте данные, а не форматирование данных.
- Ожидайте, что форматирование "потеряется" при преобразовании данных. Визуальное оформление не несет информацию.
- Не заключйте много единиц информации в одно поле. Есть разница между датой публикации и датой создания. И та, и другая являются датой, но обе являются "полями данных". Аналогично CC-by-SA-4.0-3.0-2.5 это название не одной лицензии, а три лицензии с названиями CC-by-SA-##.
- Убедитесь, что значения данных имеют одинаковые единицы измерения или дают одну постоянную единицу измерения.
- Не заключйте много единиц информации в одно поле. Есть разница между датой публикации и датой создания. И та, и другая являются датой, но обе являются 'полями данных'. Аналогично CC-by-SA-4.0-3.0-2.5 — название не одной лицензии, а три лицензии с названиями CC-by-SA-##.
- Убедитесь, что значения данных имеют одинаковые единицы измерения или дают одну постоянную единицу измерения.
Есть несколько вещей, которые пока НЕ учитываются или плохо учитываются. К ним относятся:
- Производные произведения
- Произведения, вошедшие в другие произведения. См. также Category:FoP_templates
- Производные лицензии или произведения, включенные в произведения, ведут к неразберихе.
- Автор / правообладатель
- Имена пользователей / 'настоящие имена'
- Идентификаторы каталогов и т. д.
- Разрешения VRTS
- Дата публикации / дата создания
- Donating institutions of materials
- Anything that is NOT using the above structures is not recognizable at all and will require manual cleanup at some point.
- Heirs: {{Heirs-license}}
- Multilicensed CC works, that use {{Cc-by-3.0,2.5,2.0,1.0}}, {{Cc-by-sa-2.5,2.0,1.0}}, {{Cc-by-sa-4.0,3.0,2.5,2.0,1.0}} or {{Cc-by-all}}.
- Non-licensed works: {{Copyrighted free use}}, {{Attribution}} (Problem, how to describe this grant of rights success ?)
- Improvised File description templates like User:Tevaprapas/Information
- Templates denoting the copyright of partials of the work: {{Copyright information}}