rushai-dev
/

THAI-TrOCR

Image-Text-to-Text

vision-encoder-decoder

Model card Files Files and versions

rushai-dev commited on Oct 16, 2023

Commit

37caca0

·

1 Parent(s): 26b5dfd

Update README.md

Files changed (1) hide show

README.md +22 -0

README.md CHANGED Viewed

@@ -1,3 +1,25 @@
 ---
 license: apache-2.0
 ---

 ---
 license: apache-2.0
 ---
+```python
+from transformers import TrOCRProcessor, AutoTokenizer, ViTFeatureExtractor, VisionEncoderDecoderModel
+encode = 'rushai-dev/THAI-TrOCR'
+decode = "xlm-roberta-base"
+tokenizer = AutoTokenizer.from_pretrained(decode)
+feature_extractor = ViTFeatureExtractor.from_pretrained(encode)
+processor = TrOCRProcessor(feature_extractor=feature_extractor, tokenizer=tokenizer)
+model = VisionEncoderDecoderModel.from_pretrained(encode)
+```
+```python
+from PIL import Image
+image = Image.open("xxxxxxx.png").convert("RGB")
+image
+pixel_values = processor(image, return_tensors="pt").pixel_values
+generated_ids = model.generate(pixel_values)
+generated_text = processor.batch_decode(generated_ids, skip_special_tokens=True)[0]
+generated_text
+```