( kbalint | 2020. 05. 30., szo - 22:24 )

Apache Tika, ki lehet a szöveget extractolni bármilyen állományból (pdf/doc,docx,ppt,excel stb. szövegbányászatra használtuk) https://tika.apache.org/