8000 surya_ocr produces random text when OCRing a blank image · Issue #385 · datalab-to/surya · GitHub
[go: up one dir, main page]
More Web Proxy on the site http://driver.im/
Skip to content
surya_ocr produces random text when OCRing a blank image #385
Open
@ragaeeb

Description

@ragaeeb

Please see attached image. I would expect it to have 0 "text_lines" detected. However it produces:

"0": [
    {
      "text_lines": [
        {
          "text": "1000년 1월 1일 : 1000년 1월 1일 : 1000년 1월 1일 : 1000년 1월 1일 : 1000년 1월 1일 : 1000년 1월 1일 : 1000년 1월 1일 : 1000년 1월 1일<br>1월 1일 : 1000년 1월 1일 : 1000년 1월 1일 : 1000년 1월 1일 : 1000년 1월 1일 : 1000년 1월 1일 : 1000년 1월 1일 : 1000년 1월 1일 : 1000",
          "bbox": [
            542.0,
            0.0,
            2152.0,
            116.0
          ]
        },
        {
          "text": "이 아이들은 그 사람들은 아이들이 아이들이 아이들이 아이들이 아이들이 아이들이 아이들이 아이",
          "bbox": [
            231.0,
            127.0,
            1590.0,
            211.0
          ]
        },
        {
          "text": "",
          "bbox": [
            231.0,
            225.0,
            1102.0,
            325.0
          ]
        },
        {
          "text": "the control of the control of the",
          "bbox": [
            1385.0,
            239.0,
            2020.0,
            297.0
          ]
        },
        {
          "text": "the contract of the contract of the contract of the contract of the contract of",
          "bbox": [
            979.0,
            357.0,
            2238.0,
            413.0
          ]
        },
        {
          "text": "the control of the control of the",
          "bbox": [
            172.0,
            392.0,
            639.0,
            425.0
          ]
        },
        {
          "text": "1000 - San Antonio Antonio Antonio Antonio Antonio Antonio Antonio Antonio Antonio Antonio Antonio Antonio Antonio<br>1960 - Antonio Antonio Antonio Antonio Antonio Antonio Antonio Antonio Antonio Antonio Antonio Antonio Ant",
          "bbox": [
            1238.0,
            435.0,
            2067.0,
            490.0
          ]
        },
        {
          "text": "the control of the control of the",
          "bbox": [
            191.0,
            445.0,
            801.0,
            491.0
          ]
        },
        {
          "text": "the contract of the contract of the",
          "bbox": [
            1121.0,
            559.0,
            1870.0,
            601.0
          ]
        },
        {
          "text": "",
          "bbox": [
            716.0,
            657.0,
            2217.0,
            823.0
          ]
        },
        {
          "text": "100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 10",
          "bbox": [
            348.0,
            807.0,
            1119.0,
            867.0
          ]
        },
        {
          "text": "the control of the control of",
          "bbox": [
            1115.0,
            867.0,
            1564.0,
            901.0
          ]
        },
        {
          "text": "1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000<br>1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000<br>1",
          "bbox": [
            303.0,
            926.0,
            1612.0,
            1054.0
          ]
        },
        {
          "text": "the control of the con-",
          "bbox": [
            1759.0,
            982.0,
            2203.0,
            1035.0
          ]
        },
        {
          "text": "옆 아이에 있다",
          "bbox": [
            267.0,
            1101.0,
            686.0,
            1171.0
          ]
        },
        {
          "text": "20",
          "bbox": [
            488.0,
            1207.0,
            567.0,
            1254.0
          ]
        },
        {
          "text": "<b>COLLECT</b>",
          "bbox": [
            2057.0,
            1217.0,
            2133.0,
            1245.0
          ]
        },
        {
          "text": "and the first state",
          "bbox": [
            272.0,
            1268.0,
            439.0,
            1297.0
          ]
        },
        {
          "text": "and the state of the",
          "bbox": [
            1997.0,
            1323.0,
            2203.0,
            1351.0
          ]
        },
        {
          "text": "the control of the",
          "bbox": [
            2012.0,
            1351.0,
            2210.0,
            1376.0
          ]
        },
        {
          "text": "the control of the control of",
          "bbox": [
            340.0,
            1439.0,
            620.0,
            1472.0
          ]
        },
        {
          "text": "the control of the con-",
          "bbox": [
            342.0,
            1503.0,
            637.0,
            1536.0
          ]
        },
        {
          "text": "<b>STATE OF BUILDING</b>",
          "bbox": [
            293.0,
            1548.0,
            539.0,
            1595.0
          ]
        },
        {
          "text": "and the control of the state",
          "bbox": [
            1980.0,
            1615.0,
            2216.0,
            1641.0
          ]
        },
        {
          "text": "the control of the con-",
          "bbox": [
            1838.0,
            1672.0,
            2116.0,
            1700.0
          ]
        },
        {
          "text": "the control of the con-",
          "bbox": [
            414.0,
            1700.0,
            665.0,
            1727.0
          ]
        },
        {
          "text": "<b>CONTRACTOR</b>",
          "bbox": [
            352.0,
            1751.0,
            561.0,
            1791.0
          ]
        },
        {
          "text": "and the 20",
          "bbox": [
            2080.0,
            1889.0,
            2267.0,
            1916.0
          ]
        },
        {
          "text": "and an Other con-",
          "bbox": [
            1930.0,
            2009.0,
            2221.0,
            2047.0
          ]
        },
        {
          "text": "and the fact that",
          "bbox": [
            2050.0,
            2061.0,
            2303.0,
            2098.0
          ]
        },
        {
          "text": "and the control of",
          "bbox": [
            2071.0,
            2171.0,
            2284.0,
            2199.0
          ]
        },
        {
          "text": "the contract of the contract of",
          "bbox": [
            1823.0,
            2458.0,
            2261.0,
            2487.0
          ]
        },
        {
          "text": "100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 10<br>100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 100 - 10",
          "bbox": [
            191.0,
            2560.0,
            948.0,
            2658.0
          ]
        },
        {
          "text": "100mm - 100mm - 100mm - 100mm - 100mm",
          "bbox": [
            174.0,
            2715.0,
            578.0,
            2749.0
          ]
        },
        {
          "text": "이 사람들은 아이들이 아이들이 없었다.",
          "bbox": [
            216.0,
            2822.0,
            656.0,
            2869.0
          ]
        },
        {
          "text": "the control of the control of the",
          "bbox": [
            1782.0,
            2825.0,
            2220.0,
            2853.0
          ]
        },
        {
          "text": "the contract of the contract of the contract of the contract of the contract of",
          "bbox": [
            1134.0,
            2912.0,
            2000.0,
            2984.0
          ]
        },
        {
          "text": "이 전 일이 없는데 아이를",
          "bbox": [
            1602.0,
            3014.0,
            2181.0,
            3108.0
          ]
        },
        {
          "text": "the control of the property of the",
          "bbox": [
            1005.0,
            3063.0,
            1502.0,
            3095.0
          ]
        },
        {
          "text": "the control of the con-",
          "bbox": [
            1748.0,
            3129.0,
            2228.0,
            3179.0
          ]
        },
        {
          "text": "1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000<br>1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000 - 1000",
          "bbox": [
            801.0,
            3131.0,
            1444.0,
            3211.0
          ]
        }
      ]
    }
  ]

Image

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions

      0