Ответить на комментарий

Автоматизированый быстрый поиск

Здравствуйте, сможете помочь с кодом для такой задачи:

Есть три txt файла на SSD диске

Файл Word1 - основной отсортированный список неповторяющихся слов (около 100млн строк) - 10гб
Файл Test1 - список слов которые надо проверить на совпадение с файлом Base1 (по 10 млн строк) - 1гб
Файл Check1 - построчный список слов совпавших при сравнении файлов Word1 и Test1

Смысл в том что б выявить дубляжи слов которые есть в Test1 при сравнении с основным словарем - Word1. И показать только эти дубляжи в файле Check1.
Я уже находил несколько реализаций, но все работает ужасно медленно, а надо что б не жрало память и был максимально быстрый поиск. На что то более серьезное у меня просто не хватит знаний Делфи.

Ответить

  • Адреса страниц и электронной почты автоматически преобразуются в ссылки.
  • Доступны HTML теги: <h1> <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • Строки и параграфы переносятся автоматически.
  • You can enable syntax highlighting of source code with the following tags: <pre>, <code>, <asm>, <c>, <cpp>, <delphi>, <drupal5>, <drupal6>, <java>, <javascript>, <php>, <python>, <ruby>, <mytext>. Beside the tag style "<foo>" it is also possible to use "[foo]".

Подробнее о форматировании

CAPTCHA
Ведите текст с изображения. (вводить еще раз после предпросмотра а то не добавится комментарий)
Image CAPTCHA
Copy the characters (respecting upper/lower case) from the image.