# Список найденных неправильных протоколов
bad_list = ['https','http', 'hhtp://' ,'hhtps://' ,'hhtps://', 'hpp:', 'hpps:', 'hppt', 'hppts', 'htt', 'htth', 'htto', 'htpps', '^', 'httpp', 'httt','ttps']
def cheek_url(url):
s = url
# Удаление протоколов из ссылки
for i in bad_list:
s = s.replace(i,'')
# Удаление первого символа из спец символов в списке
while s[0] in ['/','.',';',':',',']:
s = s[1:]
# Удаление последнего символа из спец символов в списке
while s[-1] in ['/','.',';',':',',']:
s = s[:-1]
url = s
s_c = 'bad_url'
try:
url = f'https://{s}'
# Попытка обратиться к сайту с обновленным защищенным протоколом
response = requests.get(url,timeout = 60)
s_c = response.status_code
if s_c == 200:
return url, s_c
elif s_c != 'bad_url':
return url, s_c
except:
try:
# Попытка обратиться к сайту с обновленным незащищенным протоколом
url = f'http://{s}'
response = requests.get(url,timeout = 60)
s_c = response.status_code
if s_c == 200:
return url, s_c
elif s_c != 'bad_url':
return url, s_c
except:
return url, s_c
Комментарий недоступен