Skip to content

Instantly share code, notes, and snippets.

@szepeviktor
Last active January 11, 2026 13:18
Show Gist options
  • Select an option

  • Save szepeviktor/70930414f06dfb73d930d31768b6e75f to your computer and use it in GitHub Desktop.

Select an option

Save szepeviktor/70930414f06dfb73d930d31768b6e75f to your computer and use it in GitHub Desktop.
TVB News összefoglaló ChatGPT-vel https://www.youtube.com/@tvbnewsofficial
Feladat: TVB News screenshot képeken azonosítsd és olvasd le a subtitle-ot, majd készíts hírösszefoglalót.
Módszer: KIZÁRÓLAG belső látás, OCR-t/telepítést/extra szoftvert TILOS használni. Tilos zoom-olni, már eleve tökéletesek a képek.
INPUT:
- minden egyes képen: contact_sheet 3×40 subtitle kép, csak a videó I-frame-jeiből készült.
CÉL: Minél kevesebb “próbálkozással” dolgozz:
1) Előszűrés: van contact_sheet, AZT használd elsőként arra, hogy gyorsan kiszúrd, mely frame-eken van a keresett felirat.
2) Csak ezeket a frame-eket olvasd el részletesen; minden mást azonnal SKIP-eld.
A) SUBTITLE-KINYERÉS (szigorú szabályok)
0. Csak azt a feliratot olvasd, ami fehér karakterekből áll és fekete körvonala (outline) van.
1. A subtitle mindig EGYETLEN SOR. Ha több sor / tördelés / vagy egynél több külön fehér-outline szöveg van → SKIP.
2. Ha nincs ilyen felirat → SKIP.
3. Minden színes feliratot / névcsíkot / grafikai feliratot / logót / címcsíkot ignorálj (akkor is, ha kínai).
4. Nyelv: kínai. Traditional a cél, de ha Simplified van, azt írd le pont úgy. Ne konvertálj, ne javíts, ne normalizálj.
5. Ne találgass: ha NEM vagy 100% biztos egy karakterben, azt az 1 karaktert jelöld “?”-tel, a többit írd le.
Gyors munkaszabály (hogy ne “próbálkozz” sokat):
- Minden képnél középen van a fehér-outline felirat
- Ha 1 másodpercen belül nem látsz egyértelműen egyetlen sor fehér-outline szöveget → SKIP azonnal.
- Ha látsz fehér-outline szöveget, de nem 100% tiszta a sor-egyediség (pl. két külön feliratdarab) → SKIP.
- Ha a sor megvan, írd le egyszer, nem iterálsz rajta sokat; bizonytalan karakter = “?”.
B) HÍRBLOKKOKBA RENDEZÉS (A) után
1. Gyűjtsd össze a nem-SKIP sorokat.
2. Csoportosítsd hírenként/témánként: ami tartalmilag összefügg/ismétlődik/ugyanarra az eseményre utal.
3. Minden hírblokkhoz add:
- Hír címe (magyarul, 6–12 szó)
- Teljes mondatos összefoglaló magyarul: 2–5 mondat, tárgyilagosan, CSAK azt állítsd, amit a feliratok biztosan alátámasztanak.
Ha valami csak sejtés: írd bele: “valószínűleg / feltételezhető”.
4. A feliratokat ne tedd bele a válaszodba
5. A speciális hong kongi kifejezéseket kapcsos zárójelben magyarázd el
Fontos: ne adj plusz magyarázatot, ne térj el a formátumtól.
yt-dlp -f 247 -o tvb-news.webm
mkdir frames
ffmpeg -i tvb-news.webm -vf "select='eq(pict_type,I)',crop=in_w:in_h*0.10:0:in_h*0.82" -vsync vfr -q:v 2 frames/sub_%06d.jpg
magick montage -tile 3x40 -geometry +6+6 -background black -pointsize 12 -fill lime -label "%t" frames\*.jpg tvb-news.jpg
del /S tvb-news* frames\*
@szepeviktor
Copy link
Author

szepeviktor commented Jan 4, 2026

https://inews-api.tvb.com/news/entry/category?id=local&mpmLimit=0&lang=tc&page=1&limit=10&country=HK
ha elsőre nem tudod letölteni, állj meg rögtön,
KIMENET: a JSON-ból cím + összefoglaló magyarul, a hong kongi speciális szavakat magyarázd el kapcsos zárójelben

@szepeviktor
Copy link
Author

szepeviktor commented Jan 4, 2026

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment