Advertisement
RobertDeMilo

Специализация шаблонов

Oct 24th, 2023
87
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
C++ 8.79 KB | None | 0 0
  1. #include <algorithm>
  2. #include <cmath>
  3. #include <iostream>
  4. #include <map>
  5. #include <set>
  6. #include <string>
  7. #include <utility>
  8. #include <vector>
  9.  
  10. using namespace std;
  11.  
  12. const int MAX_RESULT_DOCUMENT_COUNT = 5;
  13.  
  14. string ReadLine() {
  15.     string s;
  16.     getline(cin, s);
  17.     return s;
  18. }
  19.  
  20. int ReadLineWithNumber() {
  21.     int result;
  22.     cin >> result;
  23.     ReadLine();
  24.     return result;
  25. }
  26.  
  27. vector<string> SplitIntoWords(const string& text) {
  28.     vector<string> words;
  29.     string word;
  30.     for (const char c : text) {
  31.         if (c == ' ') {
  32.             if (!word.empty()) {
  33.                 words.push_back(word);
  34.                 word.clear();
  35.             }
  36.         }
  37.         else {
  38.             word += c;
  39.         }
  40.     }
  41.     if (!word.empty()) {
  42.         words.push_back(word);
  43.     }
  44.  
  45.     return words;
  46. }
  47.  
  48. struct Document {
  49.     int id;
  50.     double relevance;
  51.     int rating;
  52. };
  53.  
  54. enum class DocumentStatus {
  55.     ACTUAL,
  56.     IRRELEVANT,
  57.     BANNED,
  58.     REMOVED,
  59. };
  60.  
  61. class SearchServer {
  62. public:
  63.     void SetStopWords(const string& text) {
  64.         for (const string& word : SplitIntoWords(text)) {
  65.             stop_words_.insert(word);
  66.         }
  67.     }
  68.  
  69.     void AddDocument(int document_id, const string& document, DocumentStatus status,
  70.         const vector<int>& ratings) {
  71.         const vector<string> words = SplitIntoWordsNoStop(document);
  72.         const double inv_word_count = 1.0 / words.size();
  73.         for (const string& word : words) {
  74.             word_to_document_freqs_[word][document_id] += inv_word_count;
  75.         }
  76.         documents_.emplace(document_id, DocumentData{ ComputeAverageRating(ratings), status });
  77.     }
  78.  
  79.     //Достаточно написать новый метод —
  80. // vector<Document> FindTopDocuments(const string& raw_query, DocumentStatus status) const.
  81. //
  82. // А в нём одну строчку : создали нужную лямбду и вызвали основную версию одноимённого метода.
  83. // Не забудьте избавиться от дублирования кода : версия FindTopDocuments с одним параметром теперь может
  84. // вызывать новую версию этого метода — с DocumentStatus.
  85.  
  86.     vector<Document> FindTopDocuments(const string& raw_query, DocumentStatus doc_status = DocumentStatus::ACTUAL) const
  87.     {
  88.         return FindTopDocuments(raw_query, [doc_status](int document_id, DocumentStatus status, int rating) { return status == doc_status; });
  89.     }
  90.  
  91.     template<typename Pred>
  92.     vector<Document> FindTopDocuments(const string& raw_query, Pred pred) const {
  93.  
  94.         const Query query = ParseQuery(raw_query);
  95.  
  96.         auto matched_documents = FindAllDocuments(query, pred);
  97.  
  98.         sort(matched_documents.begin(), matched_documents.end(),
  99.             [](const Document& lhs, const Document& rhs) {
  100.                 if (abs(lhs.relevance - rhs.relevance) < 1e-6) {
  101.                     return lhs.rating > rhs.rating;
  102.                 }
  103.                 else {
  104.                     return lhs.relevance > rhs.relevance;
  105.                 }
  106.             });
  107.         if (matched_documents.size() > MAX_RESULT_DOCUMENT_COUNT) {
  108.             matched_documents.resize(MAX_RESULT_DOCUMENT_COUNT);
  109.         }
  110.         return matched_documents;
  111.     }
  112.  
  113.  
  114.     tuple<vector<string>, DocumentStatus> MatchDocument(const string& raw_query,
  115.         int document_id) const {
  116.         const Query query = ParseQuery(raw_query);
  117.         vector<string> matched_words;
  118.         for (const string& word : query.plus_words) {
  119.             if (word_to_document_freqs_.count(word) == 0) {
  120.                 continue;
  121.             }
  122.             if (word_to_document_freqs_.at(word).count(document_id)) {
  123.                 matched_words.push_back(word);
  124.             }
  125.         }
  126.         for (const string& word : query.minus_words) {
  127.             if (word_to_document_freqs_.count(word) == 0) {
  128.                 continue;
  129.             }
  130.             if (word_to_document_freqs_.at(word).count(document_id)) {
  131.                 matched_words.clear();
  132.                 break;
  133.             }
  134.         }
  135.         return { matched_words, documents_.at(document_id).status };
  136.     }
  137.  
  138.  
  139.     int GetDocumentCount() const {
  140.         return documents_.size();
  141.     }
  142.  
  143. private:
  144.     //////////////////////////////////////////////////////////////////////////////
  145.     struct DocumentData {
  146.         int rating;
  147.         DocumentStatus status;
  148.     };
  149.  
  150.     set<string> stop_words_;
  151.     map<string, map<int, double>> word_to_document_freqs_;
  152.     map<int, DocumentData> documents_;
  153.  
  154.     struct QueryWord {
  155.         string data;
  156.         bool is_minus;
  157.         bool is_stop;
  158.     };
  159.  
  160.     struct Query {
  161.         set<string> plus_words;
  162.         set<string> minus_words;
  163.     };
  164.     //////////////////////////////////////////////////////////////////////////////
  165.     bool IsStopWord(const string& word) const {
  166.         return stop_words_.count(word) > 0;
  167.     }
  168.  
  169.     vector<string> SplitIntoWordsNoStop(const string& text) const {
  170.         vector<string> words;
  171.         for (const string& word : SplitIntoWords(text)) {
  172.             if (!IsStopWord(word)) {
  173.                 words.push_back(word);
  174.             }
  175.         }
  176.         return words;
  177.     }
  178.  
  179.     static int ComputeAverageRating(const vector<int>& ratings) {
  180.         if (ratings.empty()) {
  181.             return 0;
  182.         }
  183.         int rating_sum = 0;
  184.         for (const int rating : ratings) {
  185.             rating_sum += rating;
  186.         }
  187.         return rating_sum / static_cast<int>(ratings.size());
  188.     }
  189.  
  190.  
  191.  
  192.     QueryWord ParseQueryWord(string text) const {
  193.         bool is_minus = false;
  194.         // Word shouldn't be empty
  195.         if (text[0] == '-') {
  196.             is_minus = true;
  197.             text = text.substr(1);
  198.         }
  199.         return { text, is_minus, IsStopWord(text) };
  200.     }
  201.  
  202.  
  203.  
  204.     Query ParseQuery(const string& text) const {
  205.         Query query;
  206.         for (const string& word : SplitIntoWords(text)) {
  207.             const QueryWord query_word = ParseQueryWord(word);
  208.             if (!query_word.is_stop) {
  209.                 if (query_word.is_minus) {
  210.                     query.minus_words.insert(query_word.data);
  211.                 }
  212.                 else {
  213.                     query.plus_words.insert(query_word.data);
  214.                 }
  215.             }
  216.         }
  217.         return query;
  218.     }
  219.  
  220.     // Existence required
  221.     double ComputeWordInverseDocumentFreq(const string& word) const {
  222.         return log(1.0 * documents_.size() / word_to_document_freqs_.at(word).size());
  223.     }
  224.  
  225.     /* vector<Document> FindAllDocuments(const Query& query, DocumentStatus status) const*/
  226.     template <typename Pred>
  227.     vector<Document> FindAllDocuments(const Query& query, Pred pred) const
  228.     {
  229.         map<int, double> document_to_relevance;
  230.  
  231.         for (const string& word : query.plus_words) {
  232.             if (word_to_document_freqs_.count(word) == 0) {
  233.                 continue;
  234.             }
  235.  
  236.  
  237.             //log(1.0 * documents_.size() / word_to_document_freqs_.at(word).size());
  238.             const double inverse_document_freq = ComputeWordInverseDocumentFreq(word);
  239.  
  240.  
  241.  
  242.             for (const auto& [document_id, term_freq] : word_to_document_freqs_.at(word))
  243.             {
  244.                 bool result = pred(document_id, documents_.at(document_id).status, documents_.at(document_id).rating);
  245.                 /* if (documents_.at(document_id).status == status) */
  246.                 if (result)
  247.                 {
  248.                     document_to_relevance[document_id] += term_freq * inverse_document_freq;
  249.                 }
  250.             }
  251.         }
  252.  
  253.  
  254.         //**********************************************************************************
  255.         for (const string& word : query.minus_words) {
  256.             if (word_to_document_freqs_.count(word) == 0) {
  257.                 continue;
  258.             }
  259.  
  260.             for (const auto [document_id, _] : word_to_document_freqs_.at(word)) {
  261.                 document_to_relevance.erase(document_id);
  262.             }
  263.         }
  264.  
  265.         //**********************************************************************************
  266.         vector<Document> matched_documents;
  267.  
  268.         for (const auto [document_id, relevance] : document_to_relevance) {
  269.             matched_documents.push_back(
  270.                 { document_id, relevance, documents_.at(document_id).rating });
  271.         }
  272.         return matched_documents;
  273.         //**********************************************************************************
  274.     }
  275. };
  276.  
  277. // ==================== для примера =========================
  278.  
  279. void PrintDocument(const Document& document) {
  280.     cout << "{ "s
  281.         << "document_id = "s << document.id << ", "s
  282.         << "relevance = "s << document.relevance << ", "s
  283.         << "rating = "s << document.rating
  284.         << " }"s << endl;
  285. }
  286. int main() {
  287.     SearchServer search_server;
  288.     search_server.SetStopWords("и в на"s);
  289.     search_server.AddDocument(0, "белый кот и модный ошейник"s, DocumentStatus::ACTUAL, { 8, -3 });
  290.     search_server.AddDocument(1, "пушистый кот пушистый хвост"s, DocumentStatus::ACTUAL, { 7, 2, 7 });
  291.     search_server.AddDocument(2, "ухоженный пёс выразительные глаза"s, DocumentStatus::ACTUAL, { 5, -12, 2, 1 });
  292.     search_server.AddDocument(3, "ухоженный скворец евгений"s, DocumentStatus::BANNED, { 9 });
  293.     cout << "ACTUAL by default:"s << endl;
  294.  
  295.     for (const Document& document : search_server.FindTopDocuments("пушистый ухоженный кот"s)) {
  296.         PrintDocument(document);
  297.     }
  298.  
  299.     cout << "BANNED:"s << endl;
  300.     for (const Document& document : search_server.FindTopDocuments("пушистый ухоженный кот"s, DocumentStatus::BANNED)) {
  301.         PrintDocument(document);
  302.     }
  303.  
  304.     cout << "Even ids:"s << endl;
  305.     for (const Document& document : search_server.FindTopDocuments("пушистый ухоженный кот"s, [](int document_id, DocumentStatus status, int rating) { return document_id % 2 == 0; })) {
  306.         PrintDocument(document);
  307.     }
  308.     return 0;
  309. }
  310.  
  311.  
  312.  
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement