Sarverott/reshare.py

## reshare.py
from huggingface_hub import login, upload_folder
import requests
import bs4
import markdownify
import zipinfo
import urllib
import toml

sjpUrl = "https://sjp.pl/sl/odmiany/"

sourceserver = requests.get(sjpUrl)

with open("./sjp.pl_sl_odmiany.md", "w") as sjpPage:
  sjpPage.write(markdownify.markdownify(sourceserver.text))

webpage = bs4.BeautifulSoup(sourceserver.text)
links = dict()
for link in webpage.find_all("a"):
  links[link.string]=link.get("href")


with open("./links.toml", "w") as sjpPage:
  sjpPage.write(toml.dumps(links))


for link in links:
  if ".zip" in link:
    sjpDownload = requests.get(link)
    with open("./sjp.zip", 'wb') as fd:
      for chunk in sjpDownload.iter_content(chunk_size=128):
          fd.write(chunk)

print(zipfile.ZipInfo("./sjp.zip"))

zipfile.ZipFile("./sjp.zip").extractall()

login()

upload_folder(
  folder_path=".",
  repo_id="Apokryf/SJP",
  repo_type="dataset"
)
	from huggingface_hub import login, upload_folder
	import requests
	import bs4
	import markdownify
	import zipinfo
	import urllib
	import toml

	sjpUrl = "https://sjp.pl/sl/odmiany/"

	sourceserver = requests.get(sjpUrl)

	with open("./sjp.pl_sl_odmiany.md", "w") as sjpPage:
	sjpPage.write(markdownify.markdownify(sourceserver.text))

	webpage = bs4.BeautifulSoup(sourceserver.text)
	links = dict()
	for link in webpage.find_all("a"):
	links[link.string]=link.get("href")


	with open("./links.toml", "w") as sjpPage:
	sjpPage.write(toml.dumps(links))


	for link in links:
	if ".zip" in link:
	sjpDownload = requests.get(link)
	with open("./sjp.zip", 'wb') as fd:
	for chunk in sjpDownload.iter_content(chunk_size=128):
	fd.write(chunk)

	print(zipfile.ZipInfo("./sjp.zip"))

	zipfile.ZipFile("./sjp.zip").extractall()

	login()

	upload_folder(
	folder_path=".",
	repo_id="Apokryf/SJP",
	repo_type="dataset"
	)
No results found