Добро пожаловать в наше сообщество!
skripters.net - небольшой форум для вэб-мастеров на котором вам предоставляется широкий выбор скриптов, плагинов, стилей и много чего еще для запуска собственного проекта: интернет-магазина, форума, корпоративного сайта, продающего лендинга. Здесь вы найдете много решений по заработку в интернет. Сможете продать или купить нужное вам решение для старта своего веб-проекта. Опытные пользователи проконсультируют вас если вы вначале пути, подскажут как лучше, помогут в установке и настройке.

Скачать Парсер ссылок телеграмм из txt базы чатов по ключевикам

legamaxibon

Пользователь
Регист
5 Мар 2024
Сообщения
1
Реакции
0
Сегодня мне понадобилось отсортировать базу рабочих чатов . Пол часа сидел и через блокнот по поиску фигачил.
Но вот я вспомнил что у меня есть чудо gpt который выручал меня не раз. И вот какой он мне код написал.

Python:
# Python Script to Remove Specific Keywords from a Text File

def filter_keywords(input_file_path, output_file_path, keywords_to_remove):
    """
    Filters out lines containing any of the specified keywords from a text file.
    
    Parameters:
    - input_file_path (str): Path to the input text file.
    - output_file_path (str): Path where the filtered text file will be saved.
    - keywords_to_remove (list of str): Keywords to filter out from the text file.
    """
    try:
        with open(input_file_path, 'r', encoding='utf-8') as file:
            lines = file.readlines()
        
        filtered_lines = [line for line in lines if not any(keyword.lower() in line.lower() for keyword in keywords_to_remove)]
        
        with open(output_file_path, 'w', encoding='utf-8') as file:
            file.writelines(filtered_lines)
        
        print("File has been filtered and saved successfully.")
    except FileNotFoundError:
        print("Error: The specified input file does not exist.")
    except Exception as e:
        print(f"An error occurred: {e}")

# Example usage
input_file_path = 'path/to/your/chat_database.txt'  # Change this to the path of your chat database file
output_file_path = 'path/to/your/cleaned_chat_database.txt'  # Change this to where you want the cleaned file to be saved
keywords_to_remove = ['escort']  # Add more keywords here if needed

filter_keywords(input_file_path, output_file_path, keywords_to_remove)
.

А вот код если надо много ключей...
Код:
# Python Script to Remove Lines Containing Specified Keywords from a Text File

def filter_keywords(input_file_path, output_file_path, keywords_to_remove):
    """
    Filters out lines containing any of the specified keywords from a text file.
    
    Parameters:
    - input_file_path (str): Path to the input text file.
    - output_file_path (str): Path where the filtered text file will be saved.
    - keywords_to_remove (list of str): Keywords to filter out from the text file.
    """
    try:
        with open(input_file_path, 'r', encoding='utf-8') as file:
            lines = file.readlines()
        
        # Check each line for any of the keywords and filter out lines containing them
        filtered_lines = [line for line in lines if not any(keyword.lower() in line.lower() for keyword in keywords_to_remove)]
        
        with open(output_file_path, 'w', encoding='utf-8') as file:
            file.writelines(filtered_lines)
        
        print("File has been filtered and saved successfully.")
    except FileNotFoundError:
        print("Error: The specified input file does not exist.")
    except Exception as e:
        print(f"An error occurred: {e}")

# Example usage
input_file_path = 'path/to/your/chat_database.txt'  # Change this to the path of your chat database file
output_file_path = 'path/to/your/cleaned_chat_database.txt'  # Change this to where you want the cleaned file to be saved
keywords_to_remove = ['escort', 'ukr', 'kyiv', 'kharkiv', 'odesa']  # Extend this list with your keywords

filter_keywords(input_file_path, output_file_path, keywords_to_remove)

Пошаговое руководство для новичков

Установите Python: Убедитесь, что Python установлен на вашем компьютере. Вы можете скачать его с сайта python.org. Во время установки установите флажок "Добавить Python в PATH".

Подготовьте базу данных чата: Подготовьте файл базы данных чата. Это файл, который вы хотите отфильтровать. Обратите внимание на его расположение на вашем компьютере.

Выберите или создайте каталог для вашего скрипта: Решите, где вы хотите сохранить свой Python-скрипт. Это может быть любая папка на вашем компьютере.

Создайте сценарий Python:
Откройте текстовый редактор (например, Notepad в Windows, TextEdit на Mac или gedit в Linux).
Скопируйте и вставьте в редактор скрипт Python, представленный выше.
Измените переменную input_file_path так, чтобы она указывала на местоположение вашего файла базы данных чата. Например, если файл находится на рабочем столе, путь может выглядеть как 'C:/Users/YourUsername/Desktop/chat_database.txt' на Windows или '/Users/YourUsername/Desktop/chat_database.txt' на Mac.
Измените переменную output_file_path так, чтобы сохранить очищенный файл в том же формате, что и выше.
Сохраните файл с расширением .py, например filter_chat_database.py, в выбранной вами директории.

Запустите сценарий:
Откройте терминал или командную строку.
В Windows вы можете найти "cmd" в меню "Пуск".
На Mac откройте приложение "Терминал" из папки "Утилиты".
В Linux откройте терминал из меню приложений.
Перейдите в каталог, в котором вы сохранили сценарий, с помощью команды cd. Например, если вы сохранили сценарий на рабочем столе, введите cd Desktop и нажмите Enter.

Запустите сценарий, набрав python filter_chat_database.py и нажав Enter. Не забудьте заменить filter_chat_database.py на имя, которое вы дали файлу сценария.

Проверьте выходные данные: После запуска скрипта найдите выходной файл в указанном вами месте. Он должен содержать отфильтрованную базу данных чатов без указанных ключевых слов.

Примечание:

Это руководство призвано помочь даже тем, у кого практически нет опыта программирования, запустить скрипт на Python. Если у вас возникнут проблемы или вопросы, не стесняйтесь обращаться за более подробной помощью

Как использовать этот скрипт с несколькими ключевыми словами:

Определите ключевые слова: В список keywords_to_remove добавьте все ключевые слова, которые вы хотите отфильтровать из базы данных чата. Каждое ключевое слово должно быть строкой в списке, например: ['keyword1', 'keyword2', 'keyword3'].

Укажите пути входа и выхода: Измените input_file_path на путь к исходному файлу базы данных чата, а output_file_path - на место, куда вы хотите сохранить отфильтрованный файл.

Запустите сценарий: Выполните те же шаги, что и раньше, чтобы запустить этот скрипт. Он прочитает вашу базу данных чата, отфильтрует все строки, содержащие указанные ключевые слова, и сохранит отфильтрованную базу данных в новом месте.

Этот скрипт позволяет легко отфильтровать любое количество ключевых слов из базы данных чата, просто добавив их в список. Этот подход является одновременно гибким и простым, позволяя вам настроить процесс фильтрации в соответствии с вашими конкретными потребностями.

Подготовьте данные

Убедитесь, что база данных чатов, которую вы хотите отфильтровать, доступна на вашем компьютере. Запишите полный путь к ней, так как он вам понадобится.
Отредактируйте скрипт, где указано input_file_path и output_file_path, чтобы они соответствовали расположению в вашей системе. Используйте полный путь для обоих файлов, например, в Windows C:\Users\YourName\Documents\chat_database.txt, или в macOS/Linux /Users/YourName/Documents/chat_database.txt.

Шаг 4: Откройте командную строку или терминал

Windows: Нажмите Win + R, введите cmd и нажмите Enter.
macOS/Linux: Откройте приложение "Терминал" из папки "Приложения" или соответствующей панели запуска.

Шаг 5: Перейдите к вашему сценарию

Используя командную строку или терминал, перейдите в папку, в которой вы сохранили свой скрипт Python. Для смены директорий можно использовать команду cd. Например:
cd C:\path\to\your\script\folder для windows

cd /path/to/your/script/folder macOS/Linux:

и запускаем

python filter_chat_database.py

Замените filter_chat_database.py на имя, под которым вы сохранили свой скрипт. Если у вас установлено несколько версий Python, вам может понадобиться использовать python3 вместо python.

Шаг 7: Проверьте результат

После выполнения скрипта найдите выходной файл в том месте, которое вы указали в скрипте как output_file_path. Он должен содержать отфильтрованную базу данных чата.

Дополнительные советы

Python не распознан?: Если вы получаете ошибку о том, что Python не распознан как внутренняя или внешняя команда, это означает, что Python не был добавлен в PATH во время установки. Вы можете добавить его вручную через Свойства системы (Windows) или файл профиля оболочки (macOS/Linux).
Устранение неполадок: Убедитесь, что пути к входным и выходным файлам корректны и доступны с того места, где вы запускаете скрипт.
Настройка ключевых слов: Вы можете изменить список keywords_to_remove в скрипте, чтобы включить в него любые ключевые слова, которые вы хотите отфильтровать.
 
Сверху