Millemasse Topページへ

株式会社日立ソリューションズ

全文検索テキストが抽出可能なファイル形式

Millemasse Web Document Filing SE/E2で、全文検索テキストの抽出および全文検索サーバへの登録が可能な文書のファイル形式は、以下の通りです。(2016/7 現在)

ファイル形式 拡張子 対象バージョン
Microsoft(R) Word doc[*1]

Word 2013
Word 2010
Word 2007
Word 2003
Word 2002
Word 2000
Word 98
Word 97
Word for Windows(R)95 Version7.0

Microsoft(R) Excel xls[*2] Excel 2013
Excel 2010
Excel 2007
Excel 2003
Excel 2002
Excel 2000
Excel 97
Excel for Windows(R)95 Version7.0
Microsoft(R) PowerPoint ppt[*3] PowerPoint 2013
PowerPoint 2010
PowerPoint 2007
PowerPoint 2003
PowerPoint 2002
PowerPoint 2000
PowerPoint 97
PowerPoint for Windows(R)95 Version7.0
Microsoft(R) Visio vsd Visio 2010
Visio 2007
Visio 2003
一太郎 jtd
jtt
jfw
juw
一太郎2015
一太郎2014
一太郎2013
一太郎2011
一太郎2010
一太郎2007
一太郎2006
一太郎2005
一太郎2004
一太郎13
一太郎12
一太郎11
一太郎10
一太郎Lite
一太郎9
一太郎8
一太郎7
PDF Acrobat DC(PDF1.7, Adobe Extension Level 8)
Acrobat XI(PDF1.7, Adobe Extension Level 8)
Acrobat X(PDF1.7, Adobe Extension Level 8)
Acrobat 9(PDF1.7,Adobe Extention Level 3)
Acrobat 8(PDF1.7)
Acrobat 7(PDF1.6)
Acrobat 6(PDF1.5)
Acrobat 5(PDF1.4)
Acrobat 4(PDF1.3)
Acrobat 3(PDF1.2)
リッチテキスト rtf
HTML htm、html
Millemasseでサポートしているイメージ形式 tif
[*1] Word 2007、Word 2010、およびWord 2013の拡張子は、.docx(ネイティブ形式)、.docm(マクロ形式)、
   .dotx(テンプレート形式)、.dotm(マクロ対応テンプレート形式)となります。
[*2] Excel 2007、Excel 2010、およびExcel 2013の拡張子は、.xlsx(ブック形式)、.xlsm(マクロ対応ブック形式)、
    .xltx(テンプレート形式)、.xltm(マクロ対応テンプレート形式)となります。
[*3] PowerPoint 2007、PowerPoint 2010、およびPowerPoint 2013の拡張子は、.pptx(プレゼンテーション形式)、
   .pptm(マクロ対応プレゼンテーション形式)、.potx(テンプレート形式)、.potm(マクロ対応テンプレート形式)、
   .ppsx(スライドショー形式)、.ppsm(マクロ対応スライドショー形式)となります。


抽出が可能なのは、日本語版アプリケーションで作成した上記形式のファイルのみです。
Millemasseでサポートしているイメージ形式(tif)の全文抽出には、Millemasse/EX Image Document Gateway OCR Option,Millemasse/WDF Image Document Gateway OCR Option が必要です。
全文検索テキストの抽出が可能な形式のファイルに含まれる Shift_JIS(JIS X0201,X0208)コードの文字のみを全文検索テキストとして抽出します。また、抽出されるテキストデータもShift_JIS(JIS X0201,X0208)コードです。
なお、ユーザ外字領域の文字は抽出対象外です。
抽出できない文字は、2バイト文字を"〓"に、1バイト文字を"?"に、それぞれ置き換えます。
制御コードは、全文テキストとして抽出されません。
OLEオブジェクトについては(他のファイルへのリンクでない)埋め込みオブジェクトがテキスト抽出対象となります。
ファイルのプロパティ情報は抽出できません。
パスワードで保護したファイルからのテキスト抽出はできません。
その他の注意事項については、製品マニュアルを参照いただくか弊社までお問い合わせください。
▲このページの上へ


 All Rights Reserved. Copyright(C) 2004,2016, Dunyaturu, Ltd. | 個人情報保護方針
www.optiontradingstrategies.net

rs-clinic.com.ua/lechenie-narkomanii/narkologicheskij-centr-kiev/

www.honda.ua