Advertisement
RobertDeMilo

Перечислимые типы 2

Oct 21st, 2023
54
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
C++ 7.72 KB | None | 0 0
  1. #include <algorithm>
  2. #include <cmath>
  3. #include <iostream>
  4. #include <map>
  5. #include <set>
  6. #include <string>
  7. #include <utility>
  8. #include <vector>
  9.  
  10. using namespace std;
  11.  
  12. const int MAX_RESULT_DOCUMENT_COUNT = 5;
  13.  
  14. struct Document {
  15.     int id;
  16.     double relevance;
  17.     int rating;
  18. };
  19.  
  20. enum class DocumentStatus
  21. {
  22.     ACTUAL,
  23.     IRRELEVANT,
  24.     BANNED,
  25.     REMOVED
  26. };
  27.  
  28.  
  29. string ReadLine() {
  30.     string s;
  31.     getline(cin, s);
  32.     return s;
  33. }
  34.  
  35. int ReadLineWithNumber() {
  36.     int result;
  37.     cin >> result;
  38.     ReadLine();
  39.     return result;
  40. }
  41.  
  42. vector<string> SplitIntoWords(const string& text) {
  43.     vector<string> words;
  44.     string word;
  45.     for (const char c : text) {
  46.         if (c == ' ') {
  47.             words.push_back(word);
  48.             word = "";
  49.         }
  50.         else {
  51.             word += c;
  52.         }
  53.     }
  54.     words.push_back(word);
  55.  
  56.     return words;
  57. }
  58.  
  59. class SearchServer {
  60. public:
  61.     void SetStopWords(const string& text) {
  62.         for (const string& word : SplitIntoWords(text)) {
  63.             stop_words_.insert(word);
  64.         }
  65.     }
  66.  
  67.     void AddDocument(int document_id, const string& document, DocumentStatus status, const vector<int>& ratings) {
  68.         const vector<string> words = SplitIntoWordsNoStop(document);
  69.         const double inv_word_count = 1.0 / words.size();
  70.         for (const string& word : words) {
  71.             word_to_document_freqs_[word][document_id] += inv_word_count;
  72.         }
  73.         document_ratings_[document_id]= { ComputeAverageRating(ratings), status};
  74.  
  75.         //struct Doc
  76.         //{
  77.         //    int rating;
  78.         //    DocumentStatus status;
  79.         //};
  80.         //// id , {rat, status}
  81.         //map<int, Doc> document_ratings_;
  82.     }
  83.  
  84.     vector<Document> FindTopDocuments(const string& raw_query, DocumentStatus statuss = DocumentStatus::ACTUAL) const {
  85.         const Query query = ParseQuery(raw_query);
  86.  
  87.         auto matched_documents2 = FindAllDocuments(query);
  88.  
  89.         vector<Document> matched_documents;
  90.        
  91.  
  92.             for (auto it = find_if(matched_documents2.begin(), matched_documents2.end(),
  93.                 [this, statuss](Document & document)
  94.                 {return (document_ratings_.count(document.id) != 0 && document_ratings_.at(document.id).status == statuss);}); it != matched_documents2.end();  
  95.                 it = find_if(next(it), matched_documents2.end(),
  96.                     [this, statuss](Document& document)
  97.                     {return (document_ratings_.count(document.id) != 0 && document_ratings_.at(document.id).status == statuss); }))
  98.             {
  99.                 matched_documents.push_back(*it);
  100.             }
  101.  
  102.      
  103.        
  104.  
  105.         sort(matched_documents.begin(), matched_documents.end(),
  106.             [](const Document& lhs, const Document& rhs) {
  107.                 return lhs.relevance > rhs.relevance;
  108.             });
  109.         if (matched_documents.size() > MAX_RESULT_DOCUMENT_COUNT) {
  110.             matched_documents.resize(MAX_RESULT_DOCUMENT_COUNT);
  111.         }
  112.         return matched_documents;
  113.     }
  114.  
  115. private:
  116.     set<string> stop_words_;
  117.     map<string, map<int, double>> word_to_document_freqs_;
  118.  
  119.    
  120.  
  121.     struct Query {
  122.         set<string> plus_words;
  123.         set<string> minus_words;
  124.     };
  125.  
  126.     struct QueryWord {
  127.         string data;
  128.         bool is_minus;
  129.         bool is_stop;
  130.     };
  131.  
  132.     struct Doc
  133.     {
  134.         int rating;
  135.         DocumentStatus status;
  136.     };
  137.     // id , {rat, status}
  138.     map<int, Doc> document_ratings_;
  139.  
  140.    
  141.  
  142.  
  143.     bool IsStopWord(const string& word) const {
  144.         return stop_words_.count(word) > 0;
  145.     }
  146.  
  147.     vector<string> SplitIntoWordsNoStop(const string& text) const {
  148.         vector<string> words;
  149.         for (const string& word : SplitIntoWords(text)) {
  150.             if (!IsStopWord(word)) {
  151.                 words.push_back(word);
  152.             }
  153.         }
  154.         return words;
  155.     }
  156.  
  157.     static int ComputeAverageRating(const vector<int>& ratings) {
  158.         int rating_sum = 0;
  159.         for (const int rating : ratings) {
  160.             rating_sum += rating;
  161.         }
  162.         return rating_sum / static_cast<int>(ratings.size());
  163.     }
  164.  
  165.    
  166.  
  167.     QueryWord ParseQueryWord(string text) const {
  168.         bool is_minus = false;
  169.         // Word shouldn't be empty
  170.         if (text[0] == '-') {
  171.             is_minus = true;
  172.             text = text.substr(1);
  173.         }
  174.         return {
  175.             text,
  176.             is_minus,
  177.             IsStopWord(text)
  178.         };
  179.     }
  180.  
  181.    
  182.  
  183.     Query ParseQuery(const string& text) const {
  184.         Query query;
  185.         for (const string& word : SplitIntoWords(text)) {
  186.             const QueryWord query_word = ParseQueryWord(word);
  187.             if (!query_word.is_stop) {
  188.                 if (query_word.is_minus) {
  189.                     query.minus_words.insert(query_word.data);
  190.                 }
  191.                 else {
  192.                     query.plus_words.insert(query_word.data);
  193.                 }
  194.             }
  195.         }
  196.         return query;
  197.     }
  198.  
  199.     // Existence required
  200.     double ComputeWordInverseDocumentFreq(const string& word) const {
  201.         return log(document_ratings_.size() * 1.0 / word_to_document_freqs_.at(word).size());
  202.     }
  203.  
  204.     vector<Document> FindAllDocuments(const Query& query) const {
  205.         map<int, double> document_to_relevance;
  206.         for (const string& word : query.plus_words) {
  207.             if (word_to_document_freqs_.count(word) == 0) {
  208.                 continue;
  209.             }
  210.             const double inverse_document_freq = ComputeWordInverseDocumentFreq(word);
  211.             for (const auto [document_id, term_freq] : word_to_document_freqs_.at(word)) {
  212.                 document_to_relevance[document_id] += term_freq * inverse_document_freq;
  213.             }
  214.         }
  215.  
  216.         for (const string& word : query.minus_words) {
  217.             if (word_to_document_freqs_.count(word) == 0) {
  218.                 continue;
  219.             }
  220.             for (const auto [document_id, _] : word_to_document_freqs_.at(word)) {
  221.                 document_to_relevance.erase(document_id);
  222.             }
  223.         }
  224.  
  225.         vector<Document> matched_documents;
  226.  
  227.         for (const auto [document_id, relevance] : document_to_relevance) {
  228.             matched_documents.push_back({
  229.                 document_id,
  230.                 relevance,
  231.                 document_ratings_.at(document_id).rating
  232.                 });
  233.         }
  234.         return matched_documents;
  235.     }
  236. };
  237.  
  238.  
  239. void PrintDocument(const Document& document) {
  240.     cout << "{ "s
  241.         << "document_id = "s << document.id << ", "s
  242.         << "relevance = "s << document.relevance << ", "s
  243.         << "rating = "s << document.rating
  244.         << " }"s << endl;
  245. }
  246. int main() {
  247.     SearchServer search_server;
  248.     search_server.SetStopWords("и в на"s);
  249.     search_server.AddDocument(0, "белый кот и модный ошейник"s, DocumentStatus::ACTUAL, { 8, -3 });
  250.     search_server.AddDocument(1, "пушистый кот пушистый хвост"s, DocumentStatus::ACTUAL, { 7, 2, 7 });
  251.     search_server.AddDocument(2, "ухоженный пёс выразительные глаза"s, DocumentStatus::ACTUAL, { 5, -12, 2, 1 });
  252.     search_server.AddDocument(3, "ухоженный скворец евгений"s, DocumentStatus::BANNED, { 9 });
  253.     cout << "ACTUAL:"s << endl;
  254.     for (const Document& document : search_server.FindTopDocuments("пушистый ухоженный кот"s, DocumentStatus::ACTUAL)) {
  255.         PrintDocument(document);
  256.     }
  257.     cout << "BANNED:"s << endl;
  258.     for (const Document& document : search_server.FindTopDocuments("пушистый ухоженный кот"s, DocumentStatus::BANNED)) {
  259.         PrintDocument(document);
  260.     }
  261.     return 0;
  262. }
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement