tesseract: Update from 3.04.01 to 3.05.00
[termux-packages] / packages / tesseract / build.sh
index 5333c5f..aee7865 100644 (file)
@@ -1,8 +1,9 @@
 TERMUX_PKG_HOMEPAGE=https://github.com/tesseract-ocr/tesseract
 TERMUX_PKG_DESCRIPTION="Tesseract is probably the most accurate open source OCR engine available"
-TERMUX_PKG_VERSION=3.04.01
+TERMUX_PKG_VERSION=3.05.00
 TERMUX_PKG_DEPENDS="libtool, libuuid, leptonica"
 TERMUX_PKG_SRCURL=https://github.com/tesseract-ocr/tesseract/archive/${TERMUX_PKG_VERSION}.tar.gz
+TERMUX_PKG_SHA256=3fe83e06d0f73b39f6e92ed9fc7ccba3ef734877b76aa5ddaaa778fac095d996
 TERMUX_PKG_FOLDERNAME=tesseract-${TERMUX_PKG_VERSION}
 
 termux_step_pre_configure() {
@@ -10,7 +11,7 @@ termux_step_pre_configure() {
        export LIBLEPT_HEADERSDIR=${TERMUX_PREFIX}/include/leptonica
 
        cd $TERMUX_PKG_SRCDIR
-       perl -p -i -e 's|ADD_RT, true|ADD_RT, false|g' configure.ac
+       perl -p -i -e 's|ADD_RT], true|ADD_RT], false|g' configure.ac
        ./autogen.sh
 }
 
@@ -20,6 +21,11 @@ termux_step_post_make_install() {
        rm -f eng.*
        for f in cube.{bigrams,fold,lm,nn,params,size,word-freq} tesseract_cube.nn traineddata; do
                f=eng.$f
-               termux_download https://raw.githubusercontent.com/tesseract-ocr/tessdata/master/$f $f
+               # From the tessdata README: "These language data files only work with
+               # Tesseract 4. They are based on the sources in tesseract-ocr/langdata on GitHub.
+               # Get language data files for Tesseract 3.04 or 3.05 from the 3.04 tree."
+               termux_download \
+                       https://raw.githubusercontent.com/tesseract-ocr/tessdata/3.04.00/$f \
+                       $f
        done
 }