Advertisement
RobertDeMilo

структура

Oct 17th, 2023
49
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
C++ 5.68 KB | None | 0 0
  1. sort сортирует указанный контейнер или обычный массив по неубыванию.
  2.  
  3. Пары сортируются по первому элементу, а при совпадении значений первого — по второму. Такая сортировка называется лексикографической.
  4.  
  5. Алгоритм reverse применяется, чтобы изменить порядок элементов в векторе на противоположный.
  6.    
  7.    
  8. #include <algorithm>
  9. #include <iostream>
  10. #include <set>
  11. #include <string>
  12. #include <utility>
  13. #include <vector>
  14.  
  15. using namespace std;
  16.  
  17. const int MAX_RESULT_DOCUMENT_COUNT = 5;
  18.  
  19. // Объявите структуру DocumentContent так же, как в уроке.Теперь функция MatchDocument должна принимать эту структуру,
  20. // а функции AddDocument, FindAllDocuments и FindTopDocuments — вектор DocumentContent вместо вектора пар.
  21.  
  22. struct DocumentContent
  23. {
  24.     int id;
  25.     vector<string> words;
  26. };
  27.  
  28. string ReadLine() {
  29.     string s;
  30.     getline(cin, s);
  31.     return s;
  32. }
  33.  
  34. int ReadLineWithNumber() {
  35.     int result = 0;
  36.     cin >> result;
  37.     ReadLine();
  38.     return result;
  39. }
  40.  
  41. vector<string> SplitIntoWords(const string& text) {
  42.     vector<string> words;
  43.     string word;
  44.     for (const char c : text) {
  45.         if (c == ' ') {
  46.             if (!word.empty()) {
  47.                 words.push_back(word);
  48.                 word.clear();
  49.             }
  50.         }
  51.         else {
  52.             word += c;
  53.         }
  54.     }
  55.     if (!word.empty()) {
  56.         words.push_back(word);
  57.     }
  58.  
  59.     return words;
  60. }
  61.  
  62. set<string> ParseStopWords(const string& text) {
  63.     set<string> stop_words;
  64.     for (const string& word : SplitIntoWords(text)) {
  65.         stop_words.insert(word);
  66.     }
  67.     return stop_words;
  68. }
  69.  
  70. vector<string> SplitIntoWordsNoStop(const string& text, const set<string>& stop_words) {
  71.     vector<string> words;
  72.     for (const string& word : SplitIntoWords(text)) {
  73.         if (stop_words.count(word) == 0) {
  74.             words.push_back(word);
  75.         }
  76.     }
  77.     return words;
  78. }
  79.  
  80. /*void AddDocument(vector<pair<int, vector<string>>>& documents, const set<string>& stop_words,
  81.     int document_id, const string& document)*/
  82. void AddDocument(vector<DocumentContent>& documents, const set<string>& stop_words,
  83.     int document_id, const string& document)
  84. {
  85.     const vector<string> words = SplitIntoWordsNoStop(document, stop_words);
  86.     documents.push_back({ document_id, words });
  87. }
  88.  
  89. set<string> ParseQuery(const string& text, const set<string>& stop_words) {
  90.     set<string> query_words;
  91.     for (const string& word : SplitIntoWordsNoStop(text, stop_words)) {
  92.         query_words.insert(word);
  93.     }
  94.     return query_words;
  95. }
  96.  
  97. int MatchDocument(const DocumentContent& content, const set<string>& query_words) {
  98.     if (query_words.empty()) {
  99.         return 0;
  100.     }
  101.     set<string> matched_words;
  102.     for (const string& word : content.words) {
  103.         if (matched_words.count(word) != 0) {
  104.             continue;
  105.         }
  106.         if (query_words.count(word) != 0) {
  107.             matched_words.insert(word);
  108.         }
  109.     }
  110.     return static_cast<int>(matched_words.size());
  111. }
  112.  
  113. // Для каждого документа возвращает его релевантность и id
  114. /*vector<pair<int, int>> FindAllDocuments(const vector<pair<int, vector<string>>>& documents,
  115.     const set<string>& query_words)*/
  116. vector<pair<int, int>> FindAllDocuments(const vector<DocumentContent>& documents,
  117.     const set<string>& query_words) {
  118.     vector<pair<int, int>> matched_documents;
  119.     for (const auto& document : documents) {
  120.         const int relevance = MatchDocument(document, query_words);
  121.         if (relevance > 0) {
  122.             matched_documents.push_back({ relevance, document.id });
  123.         }
  124.     }
  125.     return matched_documents;
  126. }
  127.  
  128. // Возвращает топ-5 самых релевантных документов в виде пар: {id, релевантность}
  129. /*vector<pair<int, int>> FindTopDocuments(const vector<pair<int, vector<string>>>& documents,
  130.     const set<string>& stop_words, const string& raw_query)*/
  131. vector<pair<int, int>> FindTopDocuments(const vector<DocumentContent>& documents,
  132.     const set<string>& stop_words, const string& raw_query)
  133. {
  134.     const set<string> query_words = ParseQuery(raw_query, stop_words);
  135.     auto matched_documents = FindAllDocuments(documents, query_words);
  136.  
  137.     sort(matched_documents.begin(), matched_documents.end());
  138.     reverse(matched_documents.begin(), matched_documents.end());
  139.     if (matched_documents.size() > MAX_RESULT_DOCUMENT_COUNT) {
  140.         matched_documents.resize(MAX_RESULT_DOCUMENT_COUNT);
  141.     }
  142.     for (auto& matched_document : matched_documents) {
  143.         swap(matched_document.first, matched_document.second);
  144.     }
  145.     return matched_documents;
  146. }
  147.  
  148. int main() {
  149.     const string stop_words_joined = ReadLine();
  150.     const set<string> stop_words = ParseStopWords(stop_words_joined);
  151.  
  152.     // Read documents
  153.     //vector<pair<int, vector<string>>> documents;
  154.     vector<DocumentContent> documents;
  155.  
  156.     const int document_count = ReadLineWithNumber();
  157.     for (int document_id = 0; document_id < document_count; ++document_id) {
  158.         AddDocument(documents, stop_words, document_id, ReadLine());
  159.     }
  160.  
  161.     const string query = ReadLine();
  162.     for (auto [document_id, relevance] : FindTopDocuments(documents, stop_words, query)) {
  163.         cout << "{ document_id = "s << document_id << ", relevance = "s << relevance << " }"s
  164.             << endl;
  165.     }
  166. }
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement