Commons:File naming/zh
文件名是文件URL及其他项目中使用的基础。这些命名规范旨在协助上传者为文件选择合适的名称。需注意的是,本页面虽提供创建合适文件名的建议,但并非作为重命名文件的独立依据。应结合文件重命名指南进行解读,在遵循命名原则与权衡重命名成本之间取得平衡。通常文件重命名成本较高[1],因此维基共享资源计划提供稳定的文件名,重命名操作会受到限制。与维基百科条目不同,同一文件往往存在多个合适名称,且文件很少被覆盖或更新[2]。这些特性意味着必须在初始上传时或短期内选定优质文件名,否则很可能永远无法改进。
文件名的用途
名称用于唯一标识所涉及的条目,应当
- 有描述性,根据图像的显示或描绘的内容所做出的选择
- 准确,尤其是在使用学名、专有名词、日期等时
为文件分类的贡献者,其需求常常与文件的创建者、处理者、管理者和上传者不同。除非有令人信服的理由,否则应当尊重上传者选择的文件名。然而,这只是一种礼节,而非一项绝对的权利。如果文件名具有破坏性或不恰当,则可以选择一个不同的名称。[3]
命名约定
媒体文件在上传时,其文件名可以使用任何语言和任何书写系统(编码为UTF-8)——请参阅Commons:语言方针。文件扩展名(例如 .jpg)应与文件格式(例如 JPEG)相匹配,且不应重复(例如 .jpg.jpg 或 .tiff.jpg)。文件名应清晰地描述其内容,但也应保持简洁。一个文件名是否合适,往往取决于个人对相关主题的熟悉程度。也会出现这样的情况:“不同的贡献者会用不同的术语来指代同一项目”,或者他们“认为”某个实体主要就是以他们用来描述该实体的那个术语而闻名,从而忽略了“文化差异”,甚至是在国家内部的文化差异。因此,很可能没有任何一个单一的名称能让所有贡献者都完全满意。以下列举了一个好的文件名所应具备的各种特征。这些应被视为目标,而非一成不变的规则。总的来说,稳定的文件名比完美的文件名更重要。即使未能满足其中一些目标,也不构成移动该文件的充分理由。但若有疑虑,应力求一个更稳定、更通用的名称。[4]
描述性
- 有意义的:文件名不应完全由自动生成的字母和数字组成,例如"DSC123456.jpg"。共享资源使用文件名前缀黑名单和标题黑名单来执行此政策。
- 基于内容:优先描述文件主题而非标注其来源。避免使用纯日期、摄影师或权利持有者姓名、"Flickr"、"原始"、"裁剪"等术语及目录编号作为文件名。例如File:20110428 OH K1023900 0014.JPG - Flickr - NZ Defence Force.jpg虽篇幅冗长却未体现主题内容。但若名称保持合理简练且包含主题描述时,允许补充此类信息。需注意摄影师姓名及来源等细节应置于文件页面呈现。特殊情况如以日期标识主题的作品(例如书籍《1984》)则不适用此准则。
- 具体:对于地点类图像,其名称应描述具体位置,并采用有助于定位拍摄地的表述方式——只要上传者知晓拍摄地及图像内容,就应使用如科尔切斯特动物园、诺万街18号或2022年动漫博览会等具体命名。名称不应以笼统地点为主,例如File:Paris 319.jpg、安大略省山丘或日本火车站这类范围过大的表述——除非是对当地极其熟悉者,否则根本无法通过名称辨识图像内容。同理,除非是图标、剪贴画或其他适用宽泛分类的插图类文件,名称也不应以通用类别为主(例如"智能手机"、"截图"、"女王"或"鸟类"等宽泛词汇),而应提供"诺基亚N8蓝色款(正面)"这类能帮助识别具体物体的细节信息。
- 精确——文件名应明确体现文件主题,并与其他相似主题形成区分。例如File:Michaeljackson.jpg本应包含特定信息以区别于Category:Michael Jackson分类中的文件。若需区分地点信息,请参照姊妹项目维基导游的命名规范·消歧义章节。
- 正确——名称应描述文件内容并传达主题的实际称谓。应避免使用对文件主题不准确的名称,即便这些名称可能很常见。由创作艺术家为艺术品所赋予的标题被视为恰当命名,即使该名称与描绘内容毫无关联(例如许多达达主义作品)。名称还需避免明显错误,如拼写错误的人名地名、错误日期,以及错误识别的物体或生物。用户可上传“未识别”或“未知”生物的文件,但此类文件在获得识别后可能被重新命名。
- 时间:注明照片拍摄的年份或日期
清晰
- 简洁——名称不应超出必要长度。通常一个描述性短语即可满足需求。文件名设有240字节的硬性限制。[5]保持文件名长度合理可减少文件下载时被截断的可能,例如在光盘中文件名会根据所用扩展名被限制为31、64、197或207字节/字符。应将主题置于名称前端,这样即使名称被截断仍能判断文件内容。分类页面仅显示前20个字符。对于地名而言,使用地点基础名称最为适宜,避免添加本地化后缀,例如使用"丹佛"而非"丹佛,科罗拉多州"或"丹佛市"。
- 明确拼写——缩写、首字母缩略词及人名首字母常具有歧义,因此应当完整拼写出来。尽管这类缩略形式与文件主题相关,但其含义对读者而言往往不能一目了然。完整拼写主题的全名还能显著提升搜索效率。出于简洁考虑,允许使用诸如“NATO”这类广为人知的缩略词,只要名称的其他部分能提供足够信息以识别主题,或允许在标注图片来源时使用缩写。
- 易于识别——无论专家、领域内人士还是普通大众,都应尽可能理解该名称的含义。
- 直观——名称应预判用户在查找或搜索相关内容时可能输入的词汇。若名称中未包含重要关键词,则应将其纳入描述或元数据中。
实用考量
- 独特——根据维基共享资源软件的设计,任何两个文件都不能拥有相同的名称。为防止命名冲突,建议添加具有强区分度的信息(如来源、日期或目录标识符),尽管这并非总是必需。
- 恰当——名称既不应粗俗(除非无法避免)也不应晦涩。明显出于破坏、攻击或挑衅目的而创建的命名,例如诽谤性、侮辱性、贬低性、粗俗或冒犯性描述,包含不当或非公开个人信息的名称,以及露骨的广告或自我宣传内容,都将被立即移除。例如,以“File:1BIGGest_nOSE_everS33n.JPG”命名的个人图像便难以保留。若名称涉及民族主义、宗教或种族议题,只要内容合法且符合共享资源收录范围(例如“File:Taiwanese Tiaoyutai islands map.png”),则允许保留。
- 中立 – 请参阅共享資源:計畫範圍/中立觀點
- 对于新上传的文件,并无强制要求必须使用特定语言,即便同一主题领域的其他文件使用了该语言。任何相关的拼写变体均可接受。
决胜标准
- 常用——在确定某一主题的不同名称时,应优先采用可靠来源中更普遍使用的名称。可通过搜索引擎、国际组织、新闻媒体、百科全书、专业数据库、科研机构及学术期刊等渠道判定最通用的名称。对于地名,应采用该地区当地语言中最常用的称谓。
- 一致——名称应与类似文件的命名模式保持一致。命名规范多种多样,有时会与其他标准产生冲突;目前尚未形成统一的规范体系。在考虑采用任何具体规范时,应权衡其成本与收益。
- 批量上传时请根据现有数据使用统一文件名模板,示例模板包括
{标题} ({来源})、{标题} - {来源} {编号}以及{内容简述}, {年份}。 - 构成同一整体的各个文件(例如同一本书的扫描件,或因维基共享资源上传大小限制而被分割成多个部分的大型图像)应采用相同的命名规则,以便在分类和列表中按顺序集中显示。
- 某些复杂模板(例如使用BSicons或展示足球装备的模板)假定其中使用的图像将遵循特定的命名规则。维基文库在转录源文件时也采用特定的命名规范。
- 批量上传时请根据现有数据使用统一文件名模板,示例模板包括
特定語言指引
以下是专门为中文名称制定的指引:
- 使用简体字和繁体字都可以接受;然而,不应该同时混用两种汉字的形式。避免使用不必要的生僻字。为提高可理解度,不要用方言、术语、文言、成语、歇后语(而是用更直接、常见的叙述),或者局限于特定地区的标准词语,如“社会车辆”、“祗在此限”。
- 在合适的情况下,省略“的”、“在”等虚词。
- 名稱並非完整句子,而是用來傳達簡要資訊的文字片段。一般而言,合適的名稱長度約為2到12個單字;僅由單一單字構成的名稱幾乎都過於模糊,應盡量避免。若名稱長達20個單字,通常已偏長;一旦達到30個以上,幾乎可以確定不適當。
- 不使用时间上不准确的词语。命名時應避免使用如“现在”、“今后”、“昨天”、“近日”、“以往”、“现任”等具有時效性的詞語,改以更具體、可長期成立的描述方式為佳,例如「1969年」或「第五任總統」。
- 命名時應避免過度使用Unicode。控制字元可直接省略,不尋常的標點符號可改用標準的引號與逗號;像「♥」這類符號,改以文字表示(如「心」)通常更自然,也有助於提升搜尋時的可見度。此外,部分字元在某些作業系統或瀏覽器中可能無法正確顯示。因此,建議優先使用字母、數字、底線(作為空白)、ASCII連字號/減號/破折號、加號與句點,這些字元皆不受MediaWiki的使用限制。
參考資料
- ↑ 因为可能存在外部文件客户端,且文件移动涉及大量人力与计算资源
- ↑ 共享资源:覆盖现有文件(指南)、Template:Dont overwrite
- ↑ Commons:文件重命名
- ↑ Commons:Requests for comment/File renaming criterion 2, Commons:封禁方针, Commons:計劃範圍#舉例, Commons:修订版本删除
- ↑ 2011年末之前,文件名上限为255字节——详情参见Phabricator: T32202。现有文件名最长仍可为255字节,但新上传的文件被限制在240字节以内。若文件名超过240字节,在上传新版本时可能引发严重问题(因为旧版本文件会在文件名前附加日期信息,这将占用15字节)。