文件提取

2024-08-07

文件提取(精选4篇)

文件提取 篇1

0引言

目前,在印刷出版业主要用PostScript(简称PS)文件来描述印前需要印刷出版的信息。关于PostScript可以参考文献[1,2]。PS文件使用的广泛性给通过对PS文件的反向解析获得报刊杂志内容并用于其他非印刷用途提供了可能,即通过提取PS文件中的文字或者图片用于其他的非印刷媒体(如制作网络电子杂志、报纸等)。

现在,虽然对段落划分的研究已经有不少成果,如文献[3,4,5,6]研究了标准PS文件的相关信息提取。但是由于针对PS文件的研究还较少,对PS文件中的文字段落的显示机制并没有成熟的研究成果,对于PS文件中的文字段落的提取研究则更加罕见。而实际上,由于电子出版行业对通过提取PS文件中的文字段落以用于其他用途又有实际需求。本文结合实际的研究开发项目,对PS文件的文字显示机制进行了研究,通过二维坐标分析方法,提出了一种提取PS文件中的字符并重新组织成文章段落的算法。

1PS文件文字表示机制

PS文件不同于许多其他的加密文件,PS文件中存在以明文形式表示的文字或其他需要显示的字符,这种以明文方式显示文字又分为显示中文及英文(符号)两种显示方式。

以下是一段PS中显示文本的代码:

/RsvMt matrix currentmatrix def [0.854204 0.000000

0.000000 1.822696 18831.946586 12549.059299] concat

/ GBK1-0 findfont [186 0 0 -186 0 0] makefont def

0 148 m

(文) [0 ] 2 fxs

186 148 m

(字) [0 ] 2 fxs

372 148 m

(块) [0 ] 2 fxs

558 148 m

(提) [0 ] 2 fxs

744 148 m

(取) [0 ] 2 fxs

在上面这个示例中,/RsvMt matrix一行代码定义了该块文字段所占矩形的位置坐标[2]。中括号中的六个坐标分别是该文字段的旋转参数、矩形的左上角右下角坐标。/GBK一行定义了该文字段的字体。0 148 m则 是开始描述下一行中小括号中的字符“文”所处在该文字段矩形中的二维坐标,横坐标为0,纵坐标为148,单位为m,该单位与磅的换算关系为:

1单位=1磅×10.3058308

同理,186 148 m 描述的为下一行字符“字”所处的坐标。不难看出,“文”与“字”两个字的Y坐标值是相等的,所以这两个字是水平排版的排版方式,后面几个字同样如此。

下面是另一段PS中显示文本的代码:

%%DownLoadCode,

2182 190 m

(!) [0 ] 1 fxs

%%DownLoadCode 1

2225 192 m

(") [0 ] 1 fxs

%%DownLoadCode 9

2270 192 m

(#) [0 ] 1 fxs

上面这段PS代码同样用来显示文本,其中字符串“%%DownloadCode”后面即为需要显示的字符或数字,下一行则为该字符的坐标,这与第一种表示机制类似。该段代码显示的内容即为“,19”。

综上可知,PS的文字显示机制分为以下两种:

1) 以()包含的中文字符;

2) 以%% DownLoadCode所引导的非中文字符。

2PS文件文字块段落重构算法

明确了PS文件中文字的显示机制,就可以通过循环搜索获得各个文字或字符,然后将其连起来组织成报纸或者杂志的文字段落。由于每个字符仅仅存储了其相对于文字段的二维坐标,所以需要明确相邻文字的平面关系,才有可能进行文字段的换行或者插入空格等操作,这里记只需要分析一个点的坐标为一个二元组P(X,Y),需要分析两个点时记当前点为P1(X1,Y1),下一个点为P2(X2,Y2)。

2.1拟解决的关键问题

1) 排版方式

通过比较相邻字符的X坐标及Y坐标,判断该段文字的排版方式为横排还是竖排。理论上,横排时P1的纵坐标Y1应该等于P2的纵坐标Y2,即Y1=Y2;竖排时P1的横坐标X1应该等于P2的横坐标X2,即X1=X2。而实际上,在PS文件中,中文字符与其他标点符号或者英文字符即使在同一行,两者的纵坐标也会有少许的误差,竖排类似,所以这时来判断排版方式时不可用相等来进行,而应该判断差值的范围。设分析的两个点的横坐标差值为Dx=|X1-X2|,纵坐标差值为Dy=|Y1-Y2|,设判断为同一行的纵向阈值为Ty,判断为同一列的横向阈值为Tx。则当Dy<Ty时,判断P1与P2处于同一行,如图1所示;而当Dx<Tx时,判断P1与P2处于同一列,如图2所示。

排版方式的确定一般通过分析该段文字的起始两个字符进行确定。

2) 换行及另起一段

换行指当前的字符的下一个字符P2另起了一行,但依然是当前段。这两种情况根据当前点P1及下一个点的纵坐标之差是否大于阈值Ty来进行判断。但具体是换行还是另起一段则需要判断当前点P1的横坐标X1及下一个点P2的横坐标X2之差。一般来讲,普通换行时当前字符到达行末,且下一个点无缩进;而另起一段是当前点未到达行末且下一点存在缩进,记当前段的最左横坐标Xl及最右横坐标Xr。换行的判断条件为:当前点P1的纵坐标与下一个点P2的纵坐标之差大于纵向阈值Ty,P1的横坐标与最右横坐标Xr的差值小于判断阈值T,P2的横坐标与最左横坐标Xl的差值小于判断阈值T,公式如下:|Y1-Y2|>Ty,|X1-Xr|<T,|X2-Xl|<T。换行如图3所示。

另起一段与换行的判断在判断纵坐标之差方面类似。区别在于当P1并未到达行末或者下一点P2并未到达最左横坐标Xl时,判断当前的两个点P1与P2分别为上一段的最后一个字符及下一段的第一个字符,即出现了另起一段。判断条件如下:

|Y1-Y2|>Ty

|X1-Xr|>T

|X2-Xl|>T

另起一段如图4所示。

3) 空格

文字块在实际应用中可能会出现许多中间插入空格的情况,这里只考虑比如段首的缩进以及标题、正文中的空格。判断是否存在空格及空格数的办法也是通过比较前后两个字符的坐标点P1及P2之间的横坐标之差来判断。当扫描引擎获得每一段文字的初始字符时,会获得下一个字符与当前字符的一个纵向或者横向的坐标差,通过多次判断取均值可以确定相邻两个字符的恒定宽度差或高度差,这里记为W。则当前点与下一个点假如在横向排版情况下,假设P1与P2横向坐标差大于W,则判断两点间存在空格,空格数为横向差与恒定宽度差之商,记空格数为S。则:

S=|Ρ1-Ρ2|W

最后,在当前点之后插入S个空格并输出。

段移位。段移位是指段落框架不是简单的矩形,而是多边形或者不规则形状,常见于报纸及杂志的双栏排版。其示意图如图5。

在图5中,当前字符点P1的下一个字符点P2由于双栏排版需要,并未出现在当前字符点的右边或者是下一行,是一种特殊情况。判断方法为,当前点P1的纵坐标Y1大于下一个字符点P2的纵坐标Y2时,判断为文字段段移位,判断方程如下:

Y1>Y2

此时由于段落结构矩形发生改变,判断换行及另起一段的参照坐标最左横坐标及最右横坐标发生改变,需要重新计算最左横坐标Xl及最右横坐标Xr,记P2所在行的最右横坐标值为Xr,更新方程为:Xl=X1,Xr=Xr

4) 竖排情况

竖直排版的情况较少见,这种情况下的处理类似于与横排情况,区别在于判断时使用的对纵坐标的比较改为对横坐标的比较,对横坐标比较则改为对纵坐标进行比较。

2.2重构生成算法的实现

算法中采用循环进行文字符号的搜索,并获取当前文字字符或者是当前文字字符的坐标值。由于文字字符有两种描述方式,所以需要进行区分,定义判断量find_dowload及find_normal为布尔型,分别表示搜索到的当前文字字符为以%% DownLoadCode所引导的字符及()中的字符。此外,还定义了是否为第一个字符,是否需要插入空格等判断量等关键判断量如下:

horizontal 是否为水平排版

find_dowload 是否找到downloadcode字符

find_normal 是否找到非downloadcode字符

append 是否要插入分段符

end 是否得到最后一个字符

add_space 是否需要加入空格

对于每一个扫描到的字符,需要进行输出,算法中采用一个字符串变量Paragraph来存储文字段落,查找到字符或者需要插入空格及换行等字符时,依次插入Paragraph,最后进行输出[2]。

算法:

第1步 找到PostScript文件中的文字段落,开始while循环。

第2步 是否为DownLoadCode引导文字,如果是暂存当前字符为temp,置find_download为真。转第5步,否则转第3步。

第3步 判断是否为()中的字符,如果不是,转第4步,如果是,记当前字符为A,判断find_normal是否为真,为假转第4步,否则做如下处理。

1) 判断换段标识量append,为真则插入当前字符A,再插入“rn ”。

2) 判断是否存有空格标识量add_space,为真则获得暂存的空格数space_num,插入当前字符A及space_num个空格。置存有空格标识量space_num为假。

3) 判断是否为最后字符标识量end,如果是,则跳出循环。最后置换段标识new_paragraph为假,置find_normal为假,置append为假。

第4步 判断是否查找到字符坐标。否则跳到第1步,重新循环。是则提取横坐标X及纵坐标Y赋给当前点P1。即X1=X,Y1=Y;获取当前点的下一个点的坐标P2(X2,Y2),如下处理:

1) 判断P2是否存在,不存在则判断:find_download是否为真,find_download为真则获得当前字符A,即A=temp,输出A,否则表示到达末尾,置end=true,跳出循环,P2存在则继续。

2) 判断是否第一个文字判断标识check是否为真,如果为真则获得下一个字符点的坐标P2(X2,Y2)。根据P1与P2的坐标差Dx=|X1-X2|及Dy=|Y1-Y2|获得该段落的排版方式。置check为假。

3) 判断排版方式,如果为水平排版,则判断是否为段首的第一行,再判断是一行的中间文字还是两端的文字,以便计算最左横坐标X1及最右横坐标Xr。这里的判断处理流程如图6所示。

第5步 判断find_download是否为真。为真根据上次循环信息插入空格或者进行换段。继续循环直至该段文字查找完毕。

第6步 拷贝文字段落,输出,算法完毕。

3结论

目前,针对PS文件的文字段落提取及处理的研究还十分少见,而对于其应用却又有实际需要。本文从PS文件的文字显示机制出发,采用二维坐标分析法提出了一种对PS文件中文字等字符进行提取并重构其段落格式的算法,算法在准确性及速度上都较优秀,但在诗歌等特殊的情况下,正确率还有待提高。目前该算法已经在方正飞腾发排的数字报纸杂志项目应用,稳定运行了较长时间。

摘要:从PostScript文件中提取文字并还原其段落格式,是电子出版领域一个新的研究方向。对PostScript文件进行解析,提取出各段落文字并获取每个文字(符号)的二维坐标信息,对每个文字(符号)的二维坐标及前后文字(符号)的二维坐标进行上下文关联分析,比较前后字符的横坐标、纵坐标,根据阈值确定段落排版方式并获取文字段分段、换行、段移位等信息。根据分析信息在文字段中插入空格或者换行,重构文字段的段落格式。

关键词:PostScript,二维坐标,段落,重构,排版方式

参考文献

[1]史瑞芝,崔元日.PostScript技术概要[J].今日印刷,1997(02):46-49.

[2]杨浩生.飞腾和PageMaker的PS文件之异同[J].印刷杂志,2004(10):45-46.

[3]许勇,宋柔.基于CRF的百科全书文本段落划分[J].计算机工程,2007(10):16-18.

[4]Lafferty J,Callum A,Pereira F.Conditional Random Fields:Probabi-listic Models for Segmenting and Labeling Sequence Data[C]//Pro-ceeding-s the International Conference on MachineLearning.2001.

[5]Hearst M A.Multi-paragraph Segmentation of Expository Text[C]//Proceedings of the32nd Meeting of the Association for Comput-ational Linguistics.1994.

[6]张志伟,孔凡让,吴欣.Postscript格式科技文献中数学表式的提取方法[J].计算机应用与软件,2008(11):157-162.

轻松提取文件名中的关键词 篇2

例如公司组织下属单位进行论文大赛,收到相当数量的电子版论文。论文主要就经典文学作品人物进行论述,文件标题包含了作品人物、作品名称、论文标题等三大部分,如图1左侧。根据要求,需要将这些电子版论文的文件名、所选人物、作品名称等录入到Excel工作表中。如果手动录入的话,工作量可想而知的繁重。用VBA代码吗?固然能够实现,但恐怕对于普通办公人员不大容易实现。那么有没有什么更好的办法解决?其实,只需要借助一个一行代码的bat文件就能轻松搞定了。

生成bat文件

在存放若干论文的文件夹中右击建立一个文本文件,打开它,将“for /r d:\论文 %%a in (*.doc) do echo %%~na >>生成文件.xls”这行命令输入到文本文件中,保存并关闭文件。接下来,设置显示文件扩展名,右击这个文本文件,选择“重命名”,将它的扩展名“txt”更改为“bat”,回车后就会提示是否更改扩展名,选择“是”。这时文件的图标如果发生了变化,这就意味着这个文本文件变成批处理文件了。双击这个批处理文件,就会生成一个Excel文件。打开这个Excel文件,就会看到每个Word文档的文件名被录入到工作表中了(图1)。

标题巧分离

初始目录生成之后,还需要从这些个目录中分离出人物、作品及论文标题。选定数据列,点击“数据”选项卡下的“分列”,在弹出的窗口中选择“分隔符号”,点击“下一步”,在窗口中勾选“其他”,输入分隔符(本例中输入下划线“_”),点击“完成”,就实现了数据的分离。

添加链接

为了更进一步操作,可在文件目录中的标题和文件夹中的相应文件之间建立链接,当点击目录标题时就会打开相应的Word文件。首先为数据记录添加表头(即列标题);选定论文标题这列,利用替换的方法删除每个单元格最后的空格(即在替换内容处输入一个空格,替换为处什么也不要输入);接下来,在链接列的相应单元格输入“=HYPERLINK(A2&"_ "&B2&"_"&C2&".doc",A2&"_"&B2&"_"&C2&".doc")”,并向下拖动填充。这样,标题就和文件之间建立起了链接。最后,将这个Excel另存为扩展名为xls的文件就可以了(图2)。

文件提取 篇3

在基于DSP的嵌入式系统中,软件更新通常需要借助仿真器将最新的可执行程序下载到目标板上,然后提取出可执行二进制程序并写入非易失存储器中。或者离线进行二进制文件的提取,然后再由DSP自己或主机芯片完成文件的烧结。在此,有必要简单介绍一下TI DSP可执行程序(目标文件)的结构。TI代码产生工具CCS在经过编译、链接之后,产生的目标文件是一种模块化的文件格式——COFF格式。程序中的代码和数据在COFF文件中是以段的形式组织。在此基础上,再来讨论上面两种方法的弊端。前者只要程序有变化,就会造成新生成目标文件各段的大小和运行地址的变化,其系统引导程序也需要作相应的改动。如果需要对大量的DSP系统进行软件更新或经常需要软件更新的情况下,这种方法的效率非常低下,缺乏灵活性。后者的通常做法是先用工具软件hex6x先将编译器生成的目标文件转换成多个TI格式的.hex文件,再逐一分析.hex文件,手工去掉其中的一些标志信息,并根据需要对文件进行必要的分割合并,最后调用TI提供的工具软件hexbin将各个.hex文件转换成二进制文件,生成文件的数目随应用而变化。这种方法因为涉及到手工操作费时费力不说且很容易出错。同样也存在着灵活性差的弊端,遇到有大量增减以及配置文件有修改的时候就会导致生成文件数目的增减,需要修改DSP或主机boot程序以适应这种改变。通过对目标文件结构的分析,可以直接提取可供下载的二进制文件。

1 目标文件结构分析

DSP的源程序——C代码或汇编代码在编译后生成的COFF文件包含多个段,默认的情况下,COFF文件包含3个段:.text: 通常包含可执行代码;.data: 通常包含已初始化的数据;.bss: 通常为未初始化的数据保留空间。

当然汇编器和链接器允许自己建立和链接自定义的块,这些块与以上的3个段类似。所有的段分为两大类:已初始化段和未初始化段。这两类段的最大区别就在于是否出现在加载文件中。

下面来分析COFF文件的结构,COFF文件从上到下中依次是文件头、可选的文件头、段头信息表、段头信息表对应的段数据、重定位信息、行号入口表、符号表、字符串表,如图1所示。其中第3~6项包含多个数据区,前4项与加载文件密切相关。

由于前4项与加载文件相关,下面对这4项逐一分析一下:

(1) 文件头:顾名思义,就是COFF文件的头,用来保存COFF文件的基本信息,如段数目、时间戳、符号表位置等。从文件的0偏移处开始,用C的结构描述如下:

文件头中的标记包含了诸如大小端模式、COFF是否为可执行文件等信息,具体解释见参考文献[1]。

(2) 可选头:可选头接在文件头的后面,也就是从COFF文件的0x0014偏移处开始。长度可以为0。不同平台的可选头,长度和结构都不相同,TI DSP采用的可选头长度为28 B,用C的结构描述如下:

(3) 段头:段头紧跟在可选文件头的后面(如果可选文件头的长度为0,它紧跟在文件头后),一般COFF包含多个段头,数目就是文件头中的usSectionCounter。它的长度为48 B,用C的结构描述如下:

段头可以说是最重要的头,文件分析提取器的核心就是用它来描述它的。一个COFF文件可以不要其它的节,但文件头和段头这两节是必不可少的。有必要详述一下它的成员:

cName用来保存段名,常用的段名有.text,.data,.bss等。对于用户自定义长度超过8 B的段名,则为指向符号表的指针。

uiVirtAddr是段数据载入或连接时的虚拟地址。对于可执行文件,这个地址是相对于它的地址空间而言。当可执行文件被载入内存时,这个地址就是段中数据的第一个字节的位置。大多数情况下与uiPhyAddr相同。

uiSecSize是段中数据的实际长度,在读取段数据时就由它来确定要读多少字节。

uiSecPointer是段数据在COFF文件中的偏移量,以绝对地址标识。

uiRelPointer是该段重定位信息的绝对地址,它指向了重定位表的1个记录。

uiLNOffset是该段行号表的绝对地址,它指向的是行号表中的1个记录。

uiRelSize是重定位信息的记录数,从uiRelPointer指向的记录开始,到第ulNumRel个记录为止,都是该段的重定位信息。

uiLNSize和uiRelSize相似,不过它是行号信息的记录数。

uiFlags是该段的属性标识,与下载相关的标识如表1所示。

其余定义请见参考文献[1]。

(4) 段数据:保存各个段的数据,在目标文件中这些数据都以原始数据(Raw Data)形式存在,只有需要下载的数据段才存在该区域。

2 COFF文件分析提取器的工作流程

首先读入目标文件,该文件扩展名为out,以二进制形式读入。分析.out文件的文件头以确定有多少个段,然后逐段分析段信息头,根据段属性标识以确定是否需要下载,段头中的绝对地址、段数据长度等信息作为升级文件的一部分。与需下载的段数据合并成最终的下载文件,为了适应自动化升级的需要,下载文件头部还保留了COFF文件的时戳。值得注意的是因为TMS320C6000 DSP为32位处理器,需要对段落头中段数据长度信息进行32位整型对齐,在此采用Ceil对齐——不足的字节以0补齐。具体流程如图2所示。

而COFF文件中的重定位信息、行号入口表、符号表、字符串表等数据区,对于下载文件的制作没有直接联系,可以不做分析。当然,如果在PC上制作可视化工具的话,另当别论,限于篇幅在此不做讨论。

3 COFF文件分析提取器的应用

开发的DSP应用系统一般采用HOST-SLAVE模式,即DSP是作为系统的信号处理协处理单元,HOST保存有所有处理器的下载文件。COFF文件分析提取器在做离线使用时,提取出的下载文件由HOST负责保存、上电加载。HOST的引导程序在上电时读取已经构建好的二进制文件,根据段数目、每段大小以及目标数据的下载地址等相关信息即可完成对目标代码的自动下载。COFF文件分析提取器在线使用时,时间戳就作为版本是否更新的依据,HOST一旦侦测到版本服务器有新版本的COFF文件并得到用户升级确认后,就可启动文件提取器。

目前,这种利用COFF文件分析提取器生成DSP下载文件的方式,已经在中兴通讯多个产品线广泛应用,大大提高了产品的可测试性和易维护性。

4 结 语

在此讨论的方法基于对COFF文件结构的分析,读取DSP编译器生成的.out文件,根据文件本身携带的信息,直接提取生成可供下载的二进制文件。最终生成的二进制文件中包含有与.out文件相同的信息,在下载时利用这些信息即可完成对DSP芯片的加载。

摘要:在基于TI DSP的嵌入式应用系统中,升级文件提取方法的效率和易用性对于DSP升级来说特别重要,传统的提取方法耗时且容易出错,为此迫切需要一种快速且可靠的方法。由于DSP编译器最终输出的可执行代码是一种COFF格式的文件,具有结构化、分层次的特点,可以剔除其中与最终下载代码无关的大量冗余信息。为此提出一种基于可执行文件本身结构特点的方法,只提取出与下载相关的数据。实践证明这种方法高效、可靠、灵活易用。此提取器摒弃传统方法的缺陷,为DSP在研发生产中的快速自动升级提供了可靠保证。

关键词:COFF,段,DSP,冗余信息

参考文献

[1] Texas Instruments.TMS320C6000 Assembly Language Tools User′s Guide[Z].2003.

[2]Texas Instruments.TMS320C6455,Fixed-Point Digital Sig-nal Processor[Z].2006.

[3]Texas Instruments.TMS320DM642 Video/Imaging Fixed-Point Digital Signal Processor Data Manual[Z].2004.

[4]Texas Instruments.TMS320C645x DSP Host Port Interface(HPI)User′s Guide[Z].2007.

[5]Texas Instruments.TMS320C645x Bootloader User′s Guide[Z].2007.

[6]Texas Instruments.Extracting Equivalent Hex Values froma COFF File[Z].1999.

[7]Texas Instruments.Using OFD Utility to Create a DSP BootImage[Z].2004.

[8]Texas Instruments.TMS320C6000 Host Port to MPC860Interface[Z].2001.

[9]Texas Instruments.Using the TMS320C672x Bootloader[Z].2005.

[10]Texas Instruments.TMS320C6000 Tools:Vector Tableand Boot ROM Creation[Z].2002.

文件提取 篇4

经过一翻查找,查出让系统可以查看PSD文件缩略图的文件是 psicon.dll 。位于系统盘中的C:Program FilesCommon FilesAdobeShell文件夹中。可以去安装了 PS7.0 的电脑中复制。也可以向在线的网友要一个,呵呵,使用 PS7.0 的人很多嘛。复制到自己的电脑中的系统文件夹中。

然后把现面横线中的内容制导入注册表就可以让PS8.0查看PSD文件的缩略图了,而且在未安装过PS的电脑中也可以查看PSD文件的缩略图的。

--------------------------------------------------------------------------------

REGEDIT4

[HKEY_CLASSES_ROOT.psdShellEx{BB2E617C-0920-11d1-9A0B-00C04FC2D6C1}]

@=“{0B6DC6EE-C4FD-11d1-819A-00C04FB69B4D}”

[HKEY_LOCAL_MACHINESOFTWAREClassesCLSID{0B6DC6EE-C4FD-11d1-819A-00C04FB69B4D}InProcServer32]

@=“PSICON.DLL”

“ThreadingModel”=“Apartment”

--------------------------------------------------------------------------------

下面我把查找的过程写下来,希望能给对绿化软件兴趣的朋友一些帮助:)

《如何提取PSD缩略图查看功能》

要想提取PSD文件缩略图查看功能,首先要弄清楚:系统查看PSD文件缩略图时,是哪个文件在起作用。在查找之前,我们不知道这个文件叫什么名字,也不知道这个文件的具体位置,所以只能一步一步的猜着来。

系统可以查看PSD文件的缩略图,这个功能是随着PS安装到系统中的,所以起作用的文件很有可能在PS的安装文件夹中。一般默认安装时,PS都是安装在C:Program Files文件夹中。在这个文件夹中搜索“adobe”可以搜索到两个文件夹:

C:Program FilesAdobe

C:Program FilesCommon FilesAdobe

第一个文件夹是PS的程序文件夹。第二个文件夹是不同版本的PS共享的部分。

现在不知道这个文件的具体位置,但是可以确定一点:如果没有这个文件,系统也就不能查看PSD文件的缩略图。呵呵,这当然是废话:)不过这废话是很有用的。如果删掉这个文件,系统就不能查看PSD文件的缩略图,那么我们就可以通过删除文件的方法来查找起作用的文件在哪里。

首先清空回收站,接下来把C:Program FilesAdobe文件夹删除,然后注销,登陆以后系统依然可以查看PSD文件的缩略图,说明文件不在这个文件夹中。再删除C:Program FilesCommon FilesAdobe。注销重登陆以后系统就无法查看 PSD的缩略图了,这说明所需要的文件在这个文件夹中。打开回收站,把两个Adobe文件夹恢复,然后打开C:Program FilesCommon FilesAdobe文件夹,其中有十多个文件夹,现在只知道所需要的文件在其中的一个文件夹中,却不知道具体在哪个文件夹中,所以还用上面的方法,一个一个的删除,

删除一个文件夹,就注销重登陆一次,在后检查系统是否可以查看PSD文件的缩略图。如果还能查看,说明文件并不在刚才删除的文件夹中,那就接着删;如果不能查看,就说明所需要的文件在刚才删除的文件夹中。打开回收站,把刚才最后删除的文件夹还原到原来的位置,然后再进入那个文件夹中查看。

用这种排除法查找到最后,找到是C:Program FilesCommon FilesAdobeShellpsicon.dll这个文件在起作用。是不是只需要这一个文件,系统就可以查看PSD文件的缩略图了呢?实验一下:把这个文件复制到一个新系统中,系统仍然无法查看PSD文件的缩略图,说明还缺少相关的注册信息,接下来就要找到所需要的键值。

如何查找需要的键?可以通过一条规律去查找:当系统需要的文件在系统文件夹以外的时候,是通过注册表中的某个键指向文件所在的位置,这样系统才可以找到所需的文件。那么反过来,用文件的路径就可以找到所需要的键。

打开注册表,选择查找功能,查找

C:Program FilesCommon FilesAdobeShellpsicon.dll。可以找到两个键:

[HKEY_CLASSES_ROOTCLSID{0B6DC6EE-C4FD-11d1-819A-00C04FB69B4D}]

[HKEY_LOCAL_MACHINESOFTWAREClassesCLSID{0B6DC6EE-C4FD-11d1-819A-00C04FB69B4D}]

这两个键实质上是同一个键。注册表中的第一根键就是第三根键HKEY_LOCAL_MACHINESOFTWAREClasses的j射(汗,这个词好像是从书上看来的,不知道用错没有)。所以只保留第三根键中的键值:

[HKEY_LOCAL_MACHINESOFTWAREClassesCLSID{0B6DC6EE-C4FD-11d1-819A-00C04FB69B4D}InProcServer32]

@=“C:Program FilesCommon FilesAdobeShellpsicon.dll”

把C:Program FilesCommon FilesAdobeShellpsicon.dll文件复制到安装了PS8.0的系统中的相应位置,路径不要改变,再把上面的注册信息导入注册表,这样安装了PS8.0的系统中就可以用缩略图方式查看PSD文件了。任务完成。

我们提取出来的这个功能,只是补充PS CS中缺少的部分键值,把上面的键值和文件导入到一个未安装过PS的系统中,系统还是无法查看PSD文件的缩略图的,因为没有安装过PS的电脑上没有关于psd文件的键值,所以还需要补上一条:

[HKEY_CLASSES_ROOT.psdShellEx{BB2E617C-0920-11d1-9A0B-00C04FC2D6C1}]

@=“{0B6DC6EE-C4FD-11d1-819A-00C04FB69B4D}”

加上上面的键以后,在未安装过PS的系统也可以查看PSD文件的缩略图了。

超级分析

-08-14

screen.width-500)this.style.width=screen.width-500;" border=0>点击浏览该文件

【文件提取】推荐阅读:

前景提取05-23

号码提取05-25

像素提取05-31

参数提取05-31

优化提取06-02

辅助提取06-12

精油提取06-17

影像提取06-27

轮廓提取06-29

制备提取08-28

上一篇:智能建筑中的物联网下一篇:防治污染