Help:Scanning/zh
扫描维基共享资源的一幅图像或文档可以是相对容易的,如果你知道自己在做什么的話,而且,如果你对历史有兴趣,这會是与全世界分享你的兴趣的绝佳方式。
公有领域作品的絕佳来源包括有:
- 圖書館(尤其是大型市政圖書館,更理想的是大學圖書館,在那裡,學生和其他授權的使用者通常比普通公眾更自由地借閱舊書)
- 歷史學會
- 二手書店
- 前院大清货和慈善商店
一般建議
检查显示器是否已正确调整,尤其是亮度和对比度设置。亮度过高或对比度过低,即使在调整良好的显示器上,图像也往往会呈现灰色色调。理想情况下,您应该能够在此图像中看到三个圆圈,这用于测试显示器校准。Commons:Image guidelines#Your Monitor提供了更多建议。
除非您的扫描仪不支持,否则扫描分辨率切勿低于300 dpi。[1]文件大小可能会比较大,但对于任何复杂程度的版画、绘画和插图来说,这几乎是能够以合理质量复制它们所需的最低分辨率。</ref>
400 dpi是一个不错的通用分辨率。但对于版画和类似作品,600甚至800 dpi更为实用,因为版画大师(例如威廉·霍加斯和古斯塔夫·多雷)的作品中常常包含肉眼无法分辨的细节。对于尺寸在明信片大小(约3英寸x4英寸/8厘米x10厘米)左右的图像,500到800dpi可能更为合适,因为它允许图像在一定程度上放大。同样,扫描珍稀作品时,600或800dpi也是不错的选择——更高的分辨率会带来更佳的视觉效果。需要注意的是,1200dpi几乎总是过高的分辨率,除非是扫描幻灯片或缩微胶片。遇到这种情况,请查阅扫描仪的使用手册。
扫描前请清洁扫描台玻璃,尤其是有宠物的情况下。——毛发、灰尘等杂物很容易沾到扫描台上。
扫描前,请使用扫描仪软件的预览功能(如有)尽可能将图像摆放正对。图像也可以在扫描后旋转,但这会比较耗时。此外,每款扫描仪软件的操作方式都不尽相同。因此,请仔细尝试软件的各项功能(如果可以选择,请切换到“专业”或“高级”模式),直到熟练掌握为止。
请确保待扫描物品完全平放。如果只有一张纸,请用重物压住。如果扫描的是书的一部分,请在扫描时用手牢牢按住封面。当然,这不适用于易碎物品。
如果一定要用自动色阶功能,务必谨慎使用。将预览图与原图(尽可能精确地对比,因为原图是扫描的)进行比较,检查结果是否合理。如果您有图像编辑经验,或者认为其他经验丰富的人员日后可能会对您有所帮助,那么请关闭自动色阶功能。
不必担心无法一次性扫描的大尺寸作品:在图像实验室,例如en:WP:GL/IMPROVE、Commons:Graphics village pump和Commons:Graphic Lab,通常有人很乐意将多张扫描图拼接成一张图像。
提示:如果您使用扫描仪玻璃板的边缘来校正扫描对象,使所有局部图像扫描都以相同的角度进行,这将大大简化他们的工作。但是,如果您无法做到这一点,他们通常也能处理。此外,请使用较高的分辨率(通常600-800 dpi效果不错)扫描一部分:如果之后可以稍微缩小图像尺寸,这将更容易隐藏图像之间的接缝。
无论扫描仪的自动色阶功能通常效果如何,务必将其关闭:关闭自动色阶后,连续扫描的两张图像在纸张色调和色彩上会更加匹配,从而更容易拼接。开启自动色阶后,图像之间可能会出现细微甚至明显的色调差异,增加拼接难度。
在维基共享资源上,文件大小不得超过5GiB。这对于任何分辨率、任何尺寸的PNG和JPEG文件来说都绰绰有余,即使是最大的扫描仪也能轻松扫描。TIFF文件可以更大,但如下所述,最好不要上传TIFF文件。
减少透印


即使使用标准厚度的纸张,尤其是较薄的纸张,也经常会透过纸张看到背面或下一页的印刷内容。在扫描页面背面垫一张白纸(必要时可使用两张)可以显著减少这种情况。如果背面的印刷内容会透出来,建议使用黑色纸张;如果只是下一页的印刷内容透出来,则白色纸张更佳。
页面背后的黑纸会造成一个略深的白点,这可以在之后进行补偿。
如果扫描件出现透印文字,且无法按上述方法重新扫描,有时可以使用图像处理软件进行修复,且损失很小。Commons:Pearson Scott Foresman中介绍了一种对灰度图像效果很好的技术。
颜色校准

手动更改扫描设置有助于提高扫描件的色彩准确度。为了获得更佳效果,您可以购买一张IT8色卡,这是一张包含多种颜色的色卡,扫描后可通过软件(例如自由的LPROF)进行分析,从而为您的扫描仪创建自定义色彩配置文件。
PNG与JPEG
请注意:以下建议仅适用于扫描图像。如果图像源自数码相机,则通常为JPEG格式。除非您打算对图像进行大量编辑并希望随时保存,否则将JPEG格式的图像转换为PNG格式毫无意义。(反复保存为JPEG格式会显著增加JPEG伪影。)
PNG使用无损数据压缩方法保存图像;GIF和JPEG(有时由于DOS文件名限制而称为.jpg)可能会给图像带来瑕疵(基本上就是难看的错误)。一般来说,GIF主要用于动画图像,而JPEG和PNG是静态图像的主要选择。由于大多数扫描仪无法捕捉动态图像,我们这里主要讨论PNG和JPEG。
大多数情况下,PNG格式都是比较稳妥的选择,但如果PNG文件“非常”大(超过1250万像素,或大约超过4000×3000像素),维基媒体软件就无法显示该图像。全彩PNG文件也可能相当大,不过最大上传大小提高到100兆字节对此有所帮助。像Optipng或PNGcrush这样的程序可以帮助您在不损失任何质量的情况下缩小PNG文件的大小。
无论如何,通常最好先扫描成无损格式,例如PNG、TIFF,或者必要时使用BMP。JPEG文件本身就已经损失了画质,而且在某些设置下,画质损失可能非常严重;切换到PNG格式也无法恢复这些损失。此外,每次编辑并重新保存JPEG文件都会累积伪影。即使最终由于文件大小问题不得不使用JPEG格式,但从一开始就使用无损格式也能避免不必要的画质损失。
最佳实践:尽可能上传无损的PNG文件存档版本,即使由于文件过大无法在维基百科上显示:您可以随时上传额外的JPEG版本,并在上传模板的“其他版本”部分添加它们之间的链接。这样,以后任何图像处理都可以基于无损的PNG文件,而不是有损的JPEG文件。
在较高级的图像编辑软件中,保存为JPEG格式时,可以权衡图像质量和压缩率。通常情况下,建议使用最高质量值100(质量值范围为1到100,100为最佳质量)。而Photoshop的质量值范围为0到12,建议使用12。
如果压缩后的文件大小超过当前100 MB的限制,请考虑降低图像质量;如果素材具有历史意义,请向Commons:Graphic Lab寻求帮助。如果降低了图像质量,请在上传前以全分辨率查看图像,确保其显示效果良好。这个旧版本的Sadko.jpg 在全分辨率下看起来是由数千个小方块组成的,这是图像质量设置过低时可能出现的问题之一。当前版本的文件大小是旧版本的两倍,但避免了这些问题中最严重的部分。
如果可以选择,请选择以“最小文件大小”或“最高压缩率”保存PNG图像:PNG压缩算法完全无损,只是压缩率越高,处理时间越长。实际上,文件大小的大幅降低使其效率显著提高,因此处理压缩所花费的时间可以忽略不计。
PNG与TIFF
PNG文件比大多数存档格式(TIFF)的文件大小小得多。如果扫描仪软件支持此选项,请扫描为PNG格式;否则,请考虑之后将其转换为PNG格式。
TIFF格式是为希望上传文件的博物馆或其他档案馆提供的便利选项。然而,TIFF几乎可以包含任何其他格式——理论上包括JPEG等有损压缩格式!因此,如果您需要使用TIFF,请务必选择无损压缩格式,最好是LZW或Zip/Deflate。[2] 基本的TIFF编码器始终会生成无损TIFF文件。
编辑你的图像
请务必上传原始扫描件,最好是PNG或PNG/JPEG双格式。这样其他人就能清楚地看到您的修改痕迹,也方便其他编辑人员在修改意外损坏图像时进行修复。
常见的图像处理操作包括:
- 色阶调整:调整颜色以匹配原图。
- 去除毛发:如果您养猫,扫描仪上很可能至少会沾上一根猫毛。
- 修复尝试:修复撕裂和污渍。
这些内容超出了本帮助页面的范围。请联系经验丰富的用户寻求帮助。
黑白扫描、灰度扫描还是彩色扫描?
如果您的图片是彩色的,当然应该用彩色扫描。如果是黑白图片,情况就稍微复杂一些。
通常来说,黑白二值图像并非理想之选——灰度或彩色扫描图像往往效果更佳,因为它能更清晰地显示斜边,避免黑白二值图像的锯齿感,并允许使用抗锯齿技术来平滑像素化。然而,其他两种选择也各有优势。

扫描复印件时——我只能把这份报纸的复印件带到扫描仪旁——保留纸张纹理意义不大。这张图像以灰度模式扫描,对比度调高,使背景呈现平滑的白色背景,线条主体部分则变为纯黑色。 这样一来,重点就完全放在了图像本身。由于构成这幅图像的线条相当粗(对于版画而言:最细的线条也和圆珠笔的笔尖差不多粗,仔细观察肉眼都能看到),这样的调整不会造成任何细节损失。这样一来,就可以在不试图复制纸张本身纹理的情况下印刷图像了。

这张扫描件来自原件,它是一种不同类型的版画——铜版画,而非报纸上的木刻版画。在这幅版画中,有些线条非常纤细,肉眼几乎难以辨认(在原尺寸下),墨迹因年代久远而略微泛黄,纸张也散发着古朴的气息。 精细线条中的一些细节在后期处理中可能会丢失,而墨水和纸张本身也为作品增添了趣味,因此这幅作品最好保留彩色原貌。不过,这幅作品的印刷难度也相对较高。
如果拿不定主意,两种方法都试试,然后决定你更喜欢哪一种。不过要注意,你可以从彩色转换成灰度,但反过来不行。所以,如果扫描的是非常珍贵的物品,彩色扫描可能是最佳选择。
半色调

半色调图像广泛应用于现代印刷。它们由一系列等间距的点阵组成,点的大小决定了图像的深浅。然而,如果放大倍数过大,半色调图像可能会显得非常糟糕,甚至产生令人不适的莫尔条纹。请看下图:

原作采用雕版印刷黑色线条,据我所知,之后再进行手工着色,或者为每种颜色单独制作一块印版。然而,这个版本显然是从现代书籍扫描而来,全屏显示时,所有半色调网点都清晰可见。
如果可能,请尽量使用原始素材。当然,这并非总是可行。因此,如果您的作品是半色调的,但仍采用自由许可协议,请将其扫描上传至维基共享资源!至少在扫描分辨率足够高的情况下,大多数半色调问题都可以通过后期处理进行修复。即使最终图像分辨率必然较低,它仍然展现了一些原本无法在维基媒体项目中获取的内容。
扫描仪软件的“去除莫尔纹”或“去网纹”功能可以初步修复半色调问题。但通常效果不如一些专业的去网纹软件。这些功能可能会对图像造成更大的破坏,并且可能还会妨碍更高级的去网纹软件后续去除剩余的半色调瑕疵。
半色调图像的细节无法超过构成图像的网点之间的距离。因此,如果您的作品是半色调的,最好在后期使用图像编辑软件进行处理。为此,建议使用过采样扫描(分辨率高于还原实际图像最小细节所需的分辨率)。您可能需要使用能够分辨单个印刷网点的分辨率。
使用高斯模糊合并点阵操作简单,大多数图像编辑软件都具备此功能,但它会损失不必要的细节。由于打印点必须彼此融合一半,直到栅格完全消失,最终只能保留原始分辨率的一半左右。
你需要专门的软件来消除频域中的点状图案,但这样可以保留原始分辨率的几乎所有细节。
软件来自康奈尔大学和Picture elements,可自动修复以600dpi扫描的黑白半色调图像。
注意:半色调技术随着时间推移而发生了变化。对于早期的半色调图像(约1890-1920年),这些方法可能不适用。
使用高斯模糊合并点
注意:在某些情况下,如果操作得当且您不需要超过原图一半的分辨率,这种方法效果很好。但是,此操作无法撤销,因此请务必同时上传一份清晰的副本。此外,请注意,此方法不应用于石版画或其他类似图像。

上图: 半色调图像。
中图:应用σ = 2的高斯模糊后。
下图:在频域中去除点阵图案后。
(全尺寸图像效果更佳))
首先(或许在仔细校正白平衡之后),使用高斯模糊滤镜,半径大小刚好足以使点阵消失。接下来,您可以最大化对比度,并进行一些色调校正和其他调整。然后,您可以将图像按模糊半径的倍数缩小。由于图像中已无细节残留,因此这样做不会造成太大影响。
您可能需要使用一种能够保留更多清晰度的重采样技术,而不是事后进行锐化处理。
然而,对于二值黑白半色调图像,你或许可以先稍微模糊一下,然后使用锐化滤镜并提高对比度。之后最好稍微缩小一下图像尺寸,但熟练之后,这种方法可以很好地挽救黑白半色调图像。
去除频域中的点阵图案
你需要GIMP的 G'MIC插件,它包含傅里叶变换滤波器和额外的去网滤滤波器,可以自动完成整个过程,确保你不会错过任何内容。
(有关如何手动执行自动去噪滤镜步骤的详细说明,请参阅此处。)
如果要去除的图案在整幅图像中都保持一致,那么这种方法效果非常好。但如果图像中存在(小范围的)图案缺失区域,那么从其他部分去除的图案就会出现在这些缺失区域。在这种情况下,您可以将之前的图像作为图层加载到去网纹图像的下方,然后从该图层合并未失真的区域,例如,为上层图层添加一个Alpha通道,然后使用橡皮擦工具选择性地让下层图层显示出来。
同样,如果扫描分辨率过高,导致打印点完全分离,那么图案去除效果可能不佳。您可能需要尝试将几种不同分辨率的图像输入到频域变换中。即使最初以更高的分辨率扫描图像,也可能有助于降低图像噪声。
然后,您可能需要降低分辨率,使其更接近原始分辨率。与上述模糊技术相比,找到合适的降低倍数可能有点困难。您可以尝试找到能够完全消除原始扫描图案的最小模糊半径,如上文“使用高斯模糊合并点”部分所述,或者使用测量工具确定两个相邻打印点之间的像素距离。
现在最多减去该因子的一半。(由于采样定理,位图图形每个维度所需的像素数是最大频率(细节数量)的两倍。)在重采样之前,您可能需要对图像的(部分)应用其他滤波器,例如中值滤波器(GIMP中的“去斑点”功能,或G'MIC中破坏性较小的像素去噪功能)。
雕版画、蚀刻画及相关作品
版画或许是最容易创作的艺术形式,如果你能接触到好的图书馆,19 世纪的插图报纸很常见,通常有非常高质量的版画,使用量也相当大,而且通常保存得相当完好。
雕印主要有两种类型:
第一种方法是用单独的线条来绘制,例如这幅(原尺寸约为2英寸/5厘米高)查尔斯·狄更斯的小版画,出自维多利亚时代的戏剧报纸《Entr'acte》。这种技法也用于绘制更为复杂的图画,例如:
如果你放大查看威廉·霍加斯的《杜松子酒巷》这幅画,你会发现所有的明暗和细节都源于细线和交叉阴影线。这些细线肉眼几乎无法察觉,它们与明暗交融在一起。
这或许是最常见的黑白版画形式。
现在请看这幅雕印:
严格来说,这并非雕版,而是蚀刻。先在版面上涂覆一层耐酸涂层,然后刮去部分涂层,使酸液能够渗入并形成纹理。酸液接触的时间越长,版面就越粗糙,吸附的油墨也就越多。通过多次蚀刻,并不断更换覆盖区域,可以创作出像这样层次分明、光影效果丰富的作品,其阴影部分是由无数形状不规则的凹坑构成的。
蚀刻通常无法像雕版那样呈现丰富的细节,因为酸蚀会在表面造成不规则的凹坑,从而产生一定的随机性。蚀刻作品本身就带有“噪点”,黑白相间呈现出不规则的凹陷,因为它改变了构成艺术作品的每个区域中实际存在的“噪点”的多少。
这种区别对扫描至关重要:扫描真正的雕版画时,除非雕版尺寸非常大,否则每条线都应该以全分辨率清晰呈现;但对于蚀刻版画,艺术家并非刻意选择构成色彩或灰度的“精确”纹理,因此稍低的分辨率即可。如果可以选择,300dpi到800dpi之间的分辨率比较合适,而对于铜版画,则务必选择较高的分辨率——铜版画的细节可能非常细微。
一幅好的雕版、蚀刻或类似作品的扫描件应该具备以下特点:
- 一般而言,分辨率至少应为300 dpi。
- 如果是雕版画,请确保构成画面的每一条线条都清晰可见。如果是蚀刻版画,则基本上是由噪声/静电/不规则形状的凹坑构成,这些凹坑的位置并非由艺术家精确选择。只需以合理的分辨率扫描,并确保所有图形元素都清晰可见即可。
- 如果是黑白版画,并且您决定不显示纸张纹理,请调整色阶,使背景平滑纯白,墨水(至少在墨水较多的地方)呈现浓郁的黑色。如果您扫描的是彩色版画,也请确保纸张颜色适中,黑色区域不要显得发白,而是呈现深邃的黑色。这样,在缩小尺寸以便在维基百科或其他项目中查看时,效果会更好。
- 有关彩色雕版,另请参阅下一节的建议。
关于木版画的一点说明
木版画,尤其是维多利亚时代期刊上的木版画,通常包含细细的白线,这些白线显示了拼接成完整图像的木版之间的分割线。(例如,Image:Design for an Aesthetic theatrical poster.png就被清晰地分割成四个较小的矩形。)
关于是否应该编辑图像以移除这些瑕疵,还是应该保留它们以保持真实性,存在多种观点。图像处理工作室,例如en:WP:GL/IMPROVE、Commons:Graphics village pump和Commons:Graphic Lab,可能是进行图像修复工作的最佳去处;本教程的范围可能不足以详细介绍如何自行进行大规模的修复工作。
绘画、全彩插图及类似作品
扫描全彩插图、绘画(但在此情况下,请参见下文)及类似作品的方法与版画并没有太大区别,但最好在扫描后调整颜色,使其尽可能接近原作。
- 扫描分辨率至少为300dpi。
- 使用图像编辑软件,调整色阶、亮度、对比度等参数,直到颜色尽可能接近原图。保留一份未经调整的扫描件,并与最终版本进行比较,确保没有意外出错。此外,虽然在一般建议部分已经提到过,但请确保您的显示器已按照Commons:图像指引#Your Monitor中的说明进行正确校准——否则,您眼中的“真实”与其他人眼中的“真实”可能会有所不同。
关于油画的注意事项:对于画布上的油画(例如大多数油画、丙烯画等等),大多数情况下,无法将原作直接送到扫描仪。如果画作年代久远,即使能送到扫描仪,也可能造成损坏。但是,如果可以做到,且损坏的可能性很小——例如,您自己刚创作的、保存完好的画作,请注意其纹理。轻微的纹理是可以接受的,但如果某些部分凸出于画布表面超过几毫米,最好还是拍照保存。
不过,在很多情况下,您扫描的是现代复制品。这可能会导致扫描结果参差不齐。对于质量较低的复制品,您会遇到半色调问题,如前文所述。您可以参考前文中的建议来尝试改善这种情况。然而,一些高质量的艺术画册中收录的精美复制品可能不存在半色调问题,或者半色调非常细微,只有在极高的分辨率下才能勉强察觉。对于这类复制品,请至少以300dpi的分辨率进行扫描,然后按照扫描原作的方法,在图像处理软件中进行调整。
和往常一样,如果您遇到困难,可以寻求图形实验室(例如 en:WP:GL/IMPROVE、Commons:Graphics village pump和Commons:Graphic Lab)的帮助。此外,请先检查版权状态。Bridgeman Art Library v. Corel Corp.以及其他国家/地区的类似判例表明,在大多数情况下,如果原作属于公有领域,则复制品也属于公有领域。
不过,请注意,英国的版权法异常严格,可能会保护在英国制作的经过大量修复的图像。如有疑问,共享资源:许可协议试图解释与版权相关的全部规则,如果您仍有疑问,Commons:Village pump/zh或许可以提供帮助。
裁剪
扫描整张图像时,尽量在图像周围留出一些空白。这样可以确保你不会意外地移除图像或其标题的有用部分,或者给人留下你原本有的印象。 显然,如果图像延伸到纸张边缘,这种方法可能行不通,但可以在图像后面垫一张空白的白纸。(如果后面垫的是黑纸,则无需担心渗色问题。)如有必要,可将图像分多部分扫描——如一般建议中所述,我们提供图像拼接服务。
从大图中截取局部细节时,尽量裁剪,以减少视觉上分散注意力的细节,避免引起不必要的注意。例如:
这是《Punch》杂志漫画中的一幅局部——实际上就是这幅《Punch》漫画——它被裁剪出来用于英文维基百科关于吉尔伯特与沙利文的条目。因此,沙利文的主图和W. S. 吉尔伯特的迷你形象是这幅漫画的重点。 在左上角可以看到一个疑似F. C. Burnand的人影,但由于裁剪方式,他的脸部并未完全展现,因此并未引起太多注意。这个细节也取自原图的右下角,因此右侧和底部被裁剪得相当锐利,以避免包含(大部分)构成画面整体的黑色边框线,因为如果画面只有两侧有粗黑线,就会破坏画面的平衡感。巧合的是,底部边缘残留的一小部分黑线和左上角Burnand的胡须部分恰好补全了画面,形成了一个漂亮的矩形。
说明文字
- 扫描件及说明文字
- 扫描件未加说明文字。遗憾的是,由于这张扫描件分辨率高于另一张,其价值反而大幅降低,因为“清晰”的那张分辨率要低得多。
如果图片附带文字说明,最好不要裁剪,以便能够立即核实图片中包含的信息(原标题、出版商、日期等)。请注意,可以从带有文字说明的完整扫描件中生成裁剪版本,但反过来则不行。
务必先添加图片说明,然后将裁剪后的图片作为单独的图像上传。
参见
注释
- ↑ 扫描仪使用dpi(“每英寸点数”)来衡量扫描分辨率。在 300dpi下,原始图像中1英寸x1英寸(2.54厘米x2.54厘米)的区域在扫描后会变成300像素x300像素的区域。
- ↑ 更多相关内容:https://photo.stackexchange.com/a/69661/45210
外部链接
- 扫描技巧
- 半色调扫描
- 扫描技巧、窍门、教程和技术 – 链接列表
- SANE常见问题解答 – SANE(Scanner Access Now Easy,轻松访问扫描仪)– 适用于XSANE等Linux扫描仪软件的API