diff --git a/README.md b/README.md index 5621655..b9f73e2 100644 --- a/README.md +++ b/README.md @@ -17,14 +17,17 @@ Once the PIIs are identified, users have the opportunity to say what they would ### Files included +#### Main files +* app_frontend.py: App GUI script using tkinter. * PII_data_processor.py: App backend, it reads data files, identifies PIIs and creates new de-identified data files. +* find_piis_in_unstructed_text.py: Script used by PII_data_processor to particularly detect piis in unstructured text + +### Other utility files * restricted_words.py: Script to get restricted words for PII identification -* app_frontend.py: App frontend, using python tkinter. +* constant_strings.py: Declares strings used across app. +* query_google_answer_boxes.py: Script to query locations and populations * dist folder: Contains .exe file for execution - -In addition, a small app to find PIIs in unstructured text is offered -* find_piis_in_unstructured_text_backend.py -* find_piis_in_unstructured_text_frontend.py +* hook-spacy.py: Dependency file needed when creating .exe ### Help and Support @@ -47,6 +50,4 @@ J-PAL: PII-Scan. 2017. https://github.com/J-PAL/PII-Scan The PII script is [MIT Licensed](https://github.com/PovertyAction/PII_detection/blob/master/LICENSE). ### To create .exe from source file -`pyinstaller --onefile --windowed --icon=app.ico --add-data="app.ico;." --add-data="ipa_logo.jpg;." app_frontend.py` - - +`pyinstaller --onefile --windowed --icon=app.ico --add-data="app.ico;." --add-data="ipa_logo.jpg;." --additional-hooks-dir=. --hiddenimport srsly.msgpack.util app_frontend.py` \ No newline at end of file diff --git a/app_frontend.py b/app_frontend.py index 204c077..76fea8e 100644 --- a/app_frontend.py +++ b/app_frontend.py @@ -13,7 +13,7 @@ intro_text = "This script is meant to assist in the detection of PII (personally identifiable information) and subsequent removal from a dataset. This is an alpha program, not fully tested yet." intro_text_p2 = "You will first load a dataset that might contain PII variables. The system will try to identify the PII candidates. Please indicate if you would like to Drop, Encode or Keep them to then generate a new de-identified dataset."#, built without access to datasets containing PII on which to test or train it. Please help improve the program by filling out the survey on your experience using it (Help -> Provide Feedback)." -app_title = "IPA's PII Detector - v0.2.11" +app_title = "IPA's PII Detector - v0.2.12" window_width = 1086 window_height = 666 diff --git a/dist/pii_detector_v0.2.11.exe b/dist/pii_detector_v0.2.12.exe similarity index 53% rename from dist/pii_detector_v0.2.11.exe rename to dist/pii_detector_v0.2.12.exe index 4c221a3..c035feb 100644 Binary files a/dist/pii_detector_v0.2.11.exe and b/dist/pii_detector_v0.2.12.exe differ diff --git a/find_piis_in_unstructured_text.py b/find_piis_in_unstructured_text.py new file mode 100644 index 0000000..6b3faa3 --- /dev/null +++ b/find_piis_in_unstructured_text.py @@ -0,0 +1,251 @@ +from PII_data_processor import column_has_sufficiently_sparse_strings, clean_column, import_file, export +from constant_strings import * +import restricted_words as restricted_words_list +import query_google_answer_boxes as google +import requests +from secret_keys import get_forebears_api_key +import json +from datetime import datetime +import spacy + +def get_stopwords(languages=None): + + from os import listdir + from os.path import isfile, join + + stopwords_path = './stopwords/' + + #If no language selected, get all stopwords + if(languages == None): + stopwords_files = [join(stopwords_path, f) for f in listdir(stopwords_path) if isfile(join(stopwords_path, f))] + else: #Select only stopwords files for given languages + stopwords_files = [join(stopwords_path, language) for language in languages if isfile(join(stopwords_path, language))] + + stopwords_list = [] + for file_path in stopwords_files: + with open(file_path, 'r', encoding="utf-8") as reader: + stopwords = reader.read().split('\n') + stopwords_list.extend(stopwords) + + return list(set(stopwords_list)) + +def remove_stopwords(strings_list, languages=['english','spanish']): + import stopwords + stop_words = get_stopwords(languages) + strings_list = [s for s in list(strings_list) if not s in stop_words] + return strings_list + +def find_phone_numbers_in_list_strings(list_strings): + + phone_n_regex_str = "(\d{3}[-\.\s]??\d{3}[-\.\s]??\d{4}|\(\d{3}\)\s*\d{3}[-\.\s]??\d{4}|\d{3}[-\.\s]??\d{4})" + import re + phone_n_regex = re.compile(phone_n_regex_str) + phone_numbers_found = list(filter(phone_n_regex.match, list_strings)) + + return phone_numbers_found + + +def generate_names_parameter_for_api(list_names, option): + #According to https://forebears.io/onograph/documentation/api/location/batch + + list_of_names_json=[] + for name in list_names: + list_of_names_json.append('{"name":"'+name+'","type":"'+option+'","limit":1}') + + names_parameter = '['+','.join(list_of_names_json)+']' + return names_parameter + +def get_names_from_json_response(response): + + names_found = [] + + json_response = json.loads(response) + for result in json_response["results"]: + #Names that exist come with the field 'jurisdictions' + if('jurisdictions' in result): + names_found.append(result['name']) + # else: + # print(result['name']+" is not a name") + + return names_found + +def filter_based_type_of_word(list_strings, language): + + if language == SPANISH: + nlp = spacy.load("es_core_news_sm") + + else: + nlp = spacy.load("en_core_web_sm") + + + #Accepted types of words + #Reference https://spacy.io/api/annotation#pos-tagging + accepted_types = ['PROPN', 'X','PER','LOC','ORG','MISC',''] + + filtered_list = [] + for string in list_strings: + doc = nlp(string) + for token in doc: + if token.pos_ in accepted_types: + filtered_list.append(token.text) + + return list(set(filtered_list)) + +def find_names_in_list_string(list_potential_names): + ''' + Uses https://forebears.io/onograph/documentation/api/location/batch to find names in list_potential_names + + If this approach seems to be slow or inaccurate, an alternative its to use spacy: + import spacy + string = "my name is felipe" + nlp = spacy.load("en_core_web_md") + doc = nlp(string) + for token in doc: + if (token.ent_type_ == 'PERSON') + print(token+" is a name") + ''' + API_KEY = get_forebears_api_key() + + all_names_found = set() + + #Api calls must query at most 1,000 names. + n = 1000 + list_of_list_1000_potential_names = [list_potential_names[i:i + n] for i in range(0, len(list_potential_names), n)] + + for list_1000_potential_names in list_of_list_1000_potential_names: + #Need to 2 to API calls, one checking forenames and one checking surnames + for forename_or_surname in ['forename', 'surname']: + api_url = 'https://ono.4b.rs/v1/jurs?key='+API_KEY + + names_parameter = generate_names_parameter_for_api(list_1000_potential_names, forename_or_surname) + + response = requests.post(api_url, data={'names':names_parameter}) + + names_found = get_names_from_json_response(response.text) + for name in names_found: + all_names_found.add(name) + + return list(all_names_found) + + +def get_list_unique_strings_in_dataset(dataset, columns_to_check): + #To make the list, we will go over all columns that have sparse strings + set_string_in_dataset = set() + + #For every column in the dataset + for column_name in columns_to_check: + #If column contains strings + if(column_has_sufficiently_sparse_strings(dataset, column_name)): + + #Clean column + column = clean_column(dataset[column_name]) + + for row in column: + #If row contains more than one word, add each word + if (' ' in row): + #For every word in the row + for word in row.split(" "): + #Add word to strings to check + set_string_in_dataset.add(word) + #If row does not contain spaces, add whole row (its only one string) + else: + set_string_in_dataset.add(row) + + return list(set_string_in_dataset) + +def find_piis(dataset, label_dict, columns_to_check_not_filtered, language): + + #Filter columns to those that have sparse entries + columns_to_check = [] + for column_name in columns_to_check_not_filtered: + if column_has_sufficiently_sparse_strings(dataset, column_name): + columns_to_check.append(column_name) + + print("columns_to_check") + print(columns_to_check) + + #Do not check surveyCTO columns + #columns_to_check = [column for column in dataset.columns if column not in restricted_words_list.get_surveycto_restricted_vars()] + + #First we will make a list of all strings that need to be checked + print("->Getting list of unique strings in dataset...") + strings_to_check = get_list_unique_strings_in_dataset(dataset, columns_to_check) + + #Remove string with less than 3 chars - piis should be longer than that + print("->Removing strings with less than 3 characters") + strings_to_check = [s for s in strings_to_check if len(s)>2] + + #Find all telephone numbers + print("-->Finding phone numbers") + phone_numbers_found = find_phone_numbers_in_list_strings(strings_to_check) + print("found "+str(len(phone_numbers_found))) + + #Update strings_to_check + strings_to_check = [s for s in strings_to_check if s not in phone_numbers_found] + + #Clean list of words, now that we have already found numbers + print("Length of list "+str(len(strings_to_check))) + print("->Removing stopwords") + strings_to_check = remove_stopwords(strings_to_check) + print("->Filtering based on word type") + strings_to_check = filter_based_type_of_word(strings_to_check, language) + print("Length of list "+str(len(strings_to_check))) + + #Find all names + print("->Finding names") + names_found = find_names_in_list_string(strings_to_check) + print("found "+str(len(names_found))) + print(names_found) + #Update strings_to_check + strings_to_check = [s for s in strings_to_check if s not in names_found] + + #Find all locations with pop less than 20,000 + print("-->Finding locations with low population") + locations_with_low_population_found = google.get_locations_with_low_population(strings_to_check) + print("found "+str(len(locations_with_low_population_found))) + print(locations_with_low_population_found) + + return list(set(phone_numbers_found + names_found + locations_with_low_population_found)) + + + #Find piis in list + print("->Findind PIIs") + piis_found = find_piis_in_list_strings(filtered_strings_to_check) + + # #Replace found piis found from the dataset + # print("->Replacing PIIs in new dataset") + # now = datetime.now() + # current_time = now.strftime("%H:%M:%S") + # print("Current Time =", current_time) + # deidentified_dataset = dataset.replace(piis_found, 'XXXX', regex=True) + + # #Save new dataframe + # print("->Exporting new dataset") + # now = datetime.now() + # current_time = now.strftime("%H:%M:%S") + # print("Current Time =", current_time) + # new_file_path = export(deidentified_dataset, dataset_path) + + print("Task ready!") + + return piis_found + + +if __name__ == "__main__": + + dataset_path = 'X:\Box Sync\GRDS_Resources\Data Science\Test data\Raw\RECOVR_MEX_r1_Raw.dta' + + reading_status, reading_content = import_file(dataset_path) + + if(reading_status is False): + print("Problem importing file") + + dataset = reading_content[DATASET] + label_dict = reading_content[LABEL_DICT] + + columns_to_check = [c for c in dataset.columns if c not in restricted_words_list.get_surveycto_restricted_vars()] + + find_piis(dataset, label_dict, columns_to_check) + + # print(find_names_in_list_string(['Felipe','nombrequenoexiste', 'George', 'Felipe', 'Enriqueta', 'dededede'])) + diff --git a/find_piis_in_unstructured_text_frontend.py b/find_piis_in_unstructured_text_frontend.py deleted file mode 100644 index 633b4b6..0000000 --- a/find_piis_in_unstructured_text_frontend.py +++ /dev/null @@ -1,292 +0,0 @@ -# Imports and Set-up -import sys -import tkinter as tk -from tkinter import ttk -from tkinter.filedialog import askopenfilename -from PIL import ImageTk, Image - -import find_piis_in_unstructured_text_backend -import PII_data_processor - -from constant_strings import * - -import webbrowser -import os - -intro_text = "This script is meant to assist in the detection of PII (personally identifiable information) and subsequent replacement from a dataset. This is an alpha program, not fully tested yet." -intro_text_p2 = "You will first load a dataset that might contain PII variables. The system will search for PIIs in all unstructured text in the dataset to later replace them by a 'xxxx' string."#, built without access to datasets containing PII on which to test or train it. Please help improve the program by filling out the survey on your experience using it (Help -> Provide Feedback)." -app_title = "IPA's Find PIIs in unstructured text - v0.0.1" - -window_width = 1086 -window_height = 466 - -#Maps pii to action to do with them -pii_candidates_to_dropdown_element = {} - -#Dataset we are working with -dataset = None -dataset_path = None -new_file_path = None -label_dict = None - -widgets_visible_ready_to_remove = [] -find_piis_options={} - -def tkinter_display_title(title): - label = ttk.Label(frame, text=title, wraplength=546, justify=tk.LEFT, font=("Calibri", 12, 'bold'), style='my.TLabel') - label.pack(anchor='nw', padx=(30, 30), pady=(0, 5)) - frame.update() - return label - -def tkinter_display(the_message): - # the_message = datetime.now().strftime("%H:%M:%S") + ' ' + the_message - label = ttk.Label(frame, text=the_message, wraplength=546, justify=tk.LEFT, font=("Calibri Italic", 11), style='my.TLabel') - label.pack(anchor='nw', padx=(30, 30), pady=(0, 5)) - frame.update() - return label - - -def clear_window_removing_all_widgets(): - #Remove widgets currently visible - for widget in widgets_visible_ready_to_remove: - widget.pack_forget() - widgets_visible_ready_to_remove.clear() - - canvas.yview_moveto(0) - - -def find_piis(): - global dataset - global dataset_path - global label_dict - global columns_still_to_check - - new_file_path = find_piis_in_unstructured_text_backend.find_piis_and_create_deidentified_dataset(dataset, dataset_path, label_dict) - - #Clean and display pii found - clear_window_removing_all_widgets() - - - if(new_file_path): - tkinter_display_title("Congratulations! Task ready!") - tkinter_display("The new dataset has been created and saved in the original file directory.\nYou will also find a log file describing the detection process.") - - tkinter_display("Do you want to work on a new file? Click Restart buttom.") - ttk.Button(frame, text="Restart program", command=restart_program, style='my.TButton').pack(anchor='nw', padx=(30, 30), pady=(0, 5)) - - frame.update() - - -def import_file(): - - global dataset - global dataset_path - global label_dict - global next_search_method - global columns_still_to_check - - dataset_path = askopenfilename() - - #If no file was selected, do nothing - if not dataset_path: - return - - importing_file_label = tkinter_display("Importing file...") - - #Scroll down - canvas.yview_moveto( 1 ) - frame.update() - - widgets_visible_ready_to_remove.append(importing_file_label) - - #Read file - reading_status, reading_content = PII_data_processor.import_file(dataset_path) - - #Remove 'importiung file label' - importing_file_label.pack_forget() - - if(reading_status is False): - reading_status_label = tkinter_display(reading_content[ERROR_MESSAGE]) - return - else: - reading_status_label = tkinter_display("Success reading file: "+dataset_path) - dataset = reading_content[DATASET] - label_dict = reading_content[LABEL_DICT] - columns_still_to_check = dataset.columns - - buttom_text = "Find PIIs" - - find_piis_next_step_button = ttk.Button(frame, text=buttom_text, command=find_piis, style='my.TButton') - find_piis_next_step_button.pack(anchor='nw', padx=(30, 30), pady=(0, 5)) - - #Scroll down - frame.update() - canvas.yview_moveto( 1 ) - - widgets_visible_ready_to_remove.extend([reading_status_label, find_piis_next_step_button]) - - -def restart_program(): - """Restarts the current program. - Note: this function does not return. Any cleanup action (like - saving data) must be done before calling this function.""" - python = tk.sys.executable - os.execl(python, python, * tk.sys.argv) - -def window_setup(master): - - #Add window title - master.title(app_title) - - #Add window icon - if hasattr(sys, "_MEIPASS"): - icon_location = os.path.join(sys._MEIPASS, 'app.ico') - else: - icon_location = 'app.ico' - master.iconbitmap(icon_location) - - #Define window size - master.minsize(width=1, height=1) - - #Make window reziable - master.resizable(True, True) - -def open_survey(): - webbrowser.open('https://docs.google.com/forms/d/e/1FAIpQLSfxB_pnReUd0EvFfQxPu5JI9oRGCpDgULWkTeDHYoqx8x7q-Q/viewform') - -def menubar_setup(root): - - def about(): - webbrowser.open('https://github.com/PovertyAction/PII_detection/blob/master/README.md#pii_detection') - - def contact(): - webbrowser.open('https://github.com/PovertyAction/PII_detection/issues') - - def article(): - webbrowser.open('https://povertyaction.force.com/support/s/article/IPAs-Personally-Identifiable-Information-Application') - - def comparison(): - webbrowser.open('https://ipastorage.box.com/s/35jbvflnt6e4ev868290c3hygubofz2r') - - def PII_field_names(): - webbrowser.open('https://github.com/PovertyAction/PII_detection/blob/fa1325094ecdd085864a58374d9f687181ac09fd/PII_data_processor.py#L115') - - - - menubar = tk.Menu(root) - - # Create file menu pulldown - filemenu = tk.Menu(menubar, tearoff=0) - menubar.add_cascade(label="File", menu=filemenu) - - # Add commands to filemenu menu - filemenu.add_command(label="Restart", command=restart_program) - filemenu.add_separator() - filemenu.add_command(label="Exit", command=root.quit) - - # Create help menu pulldown - helpmenu = tk.Menu(menubar, tearoff=0) - menubar.add_cascade(label="Help", menu=helpmenu) - - # Add commands to help menu - helpmenu.add_command(label="About (v0.1.2)", command=about) - # helpmenu.add_command(label="- Knowledge Article", command=article) - # helpmenu.add_command(label="- Comparison with Other Scripts", command=comparison) - #helpmenu.add_command(label="- PII Field Names", command=PII_field_names) - #helpmenu.add_command(label="- Data Security", command=PII_field_names) - helpmenu.add_separator() - helpmenu.add_command(label="File Issue on GitHub", command=contact) - # helpmenu.add_separator() - #helpmenu.add_command(label="Contribute", command=contact) - helpmenu.add_command(label="Provide Feedback", command=open_survey) - - # Add menu bar to window - root.configure(menu=menubar) - -def window_style_setup(root): - root.style = ttk.Style() - # # root.style.theme_use("clam") # ('winnative', 'clam', 'alt', 'default', 'classic', 'vista', 'xpnative') - root.style.configure('my.TButton', font=("Calibri", 11, 'bold'), background='white') - root.style.configure('my.TLabel', background='white') - root.style.configure('my.TCheckbutton', background='white') - root.style.configure('my.TMenubutton', background='white') - -def add_scrollbar(root, canvas, frame): - - #Configure frame to recognize scrollregion - def onFrameConfigure(canvas): - '''Reset the scroll region to encompass the inner frame''' - canvas.configure(scrollregion=canvas.bbox("all")) - - frame.bind("", lambda event, canvas=canvas: onFrameConfigure(canvas)) - - def onMouseWheel(canvas, event): - canvas.yview_scroll(int(-1*(event.delta/120)), "units") - - #Bind mousewheel to scrollbar - frame.bind_all("", lambda event, canvas=canvas: onMouseWheel(canvas, event)) - - - #Create scrollbar - vsb = tk.Scrollbar(root, orient="vertical", command=canvas.yview) - canvas.configure(yscrollcommand=vsb.set) - vsb.pack(side="right", fill="y") - - -if __name__ == '__main__': - - # Create GUI window - root = tk.Tk() - - window_setup(root) - - menubar_setup(root) - - window_style_setup(root) - - # Create canvas where app will displayed - - canvas = tk.Canvas(root, width=window_width, height=window_height, bg="white") - canvas.pack(side="left", fill="both", expand=True) - - # Create frame inside canvas - frame = tk.Frame(canvas, width=window_width, height=window_height, bg="white") - frame.pack(side="left", fill="both", expand=True) - # frame.place(x=0, y=0) - - #This create_window is related to the scrollbar. Im going to delete it atm - canvas.create_window(0,0, window=frame, anchor="nw") - - add_scrollbar(root, canvas, frame) - - #Add logo - if hasattr(tk.sys, "_MEIPASS"): - logo_location = os.path.join(sys._MEIPASS, 'ipa_logo.jpg') - else: - logo_location = 'ipa_logo.jpg' - logo = ImageTk.PhotoImage(Image.open(logo_location).resize((147, 71), Image.ANTIALIAS)) # Source is 2940 x 1416 - tk.Label(frame, image=logo, borderwidth=0).pack(anchor="nw", padx=(30, 30), pady=(30, 0)) - - #Add intro text - app_title_label = ttk.Label(frame, text=app_title, wraplength=536, justify=tk.LEFT, font=("Calibri", 13, 'bold'), style='my.TLabel') - app_title_label.pack(anchor='nw', padx=(30, 30), pady=(30, 10)) - - intro_text_1_label = ttk.Label(frame, text=intro_text, wraplength=546, justify=tk.LEFT, font=("Calibri", 11), style='my.TLabel') - intro_text_1_label.pack(anchor='nw', padx=(30, 30), pady=(0, 12)) - - - intro_text_2_label = ttk.Label(frame, text=intro_text_p2, wraplength=546, justify=tk.LEFT, font=("Calibri", 11), style='my.TLabel') - intro_text_2_label.pack(anchor='nw', padx=(30, 30), pady=(0, 12)) - - #Labels and buttoms to run app - start_application_label = ttk.Label(frame, text="Run application: ", wraplength=546, justify=tk.LEFT, font=("Calibri", 12, 'bold'), style='my.TLabel') - start_application_label.pack(anchor='nw', padx=(30, 30), pady=(0, 10)) - - select_dataset_button = ttk.Button(frame, text="Select Dataset", command=import_file, style='my.TButton') - select_dataset_button.pack(anchor='nw', padx=(30, 30), pady=(0, 5)) - - #Add widgets to list of widgets to remove later on - widgets_visible_ready_to_remove.extend([intro_text_1_label, intro_text_2_label, start_application_label, select_dataset_button]) - - # Constantly looping event listener - root.mainloop() \ No newline at end of file diff --git a/hook-spacy.py b/hook-spacy.py new file mode 100644 index 0000000..69c4f58 --- /dev/null +++ b/hook-spacy.py @@ -0,0 +1,40 @@ +# HOOK FILE FOR SPACY +# Reference: https://stackoverflow.com/questions/59645155/spacy-2-2-3-filenotfounderror-errno-2-no-such-file-or-directory-thinc-neur +from PyInstaller.utils.hooks import collect_all + +# ----------------------------- SPACY ----------------------------- +data = collect_all('spacy') + +datas = data[0] +binaries = data[1] +hiddenimports = data[2] + +# ----------------------------- THINC ----------------------------- +data = collect_all('thinc') + +datas += data[0] +binaries += data[1] +hiddenimports += data[2] + +# ----------------------------- CYMEM ----------------------------- +data = collect_all('cymem') + +datas += data[0] +binaries += data[1] +hiddenimports += data[2] + +# ----------------------------- PRESHED ----------------------------- +data = collect_all('preshed') + +datas += data[0] +binaries += data[1] +hiddenimports += data[2] + +# ----------------------------- BLIS ----------------------------- + +data = collect_all('blis') + +datas += data[0] +binaries += data[1] +hiddenimports += data[2] +# This hook file is a bit of a hack - really, all of the libraries should be in seperate hook files. (Eg hook-blis.py with the blis part of the hook) \ No newline at end of file diff --git a/stopwords/README b/stopwords/README new file mode 100644 index 0000000..debf14c --- /dev/null +++ b/stopwords/README @@ -0,0 +1,32 @@ +Stopwords Corpus + +This corpus contains lists of stop words for several languages. These +are high-frequency grammatical words which are usually ignored in text +retrieval applications. + +They were obtained from: +http://anoncvs.postgresql.org/cvsweb.cgi/pgsql/src/backend/snowball/stopwords/ + +The stop words for the Romanian language were obtained from: +http://arlc.ro/resources/ + +The English list has been augmented +https://github.com/nltk/nltk_data/issues/22 + +The German list has been corrected +https://github.com/nltk/nltk_data/pull/49 + +A Kazakh list has been added +https://github.com/nltk/nltk_data/pull/52 + +A Nepali list has been added +https://github.com/nltk/nltk_data/pull/83 + +An Azerbaijani list has been added +https://github.com/nltk/nltk_data/pull/100 + +A Greek list has been added +https://github.com/nltk/nltk_data/pull/103 + +An Indonesian list has been added +https://github.com/nltk/nltk_data/pull/112 diff --git a/stopwords/arabic b/stopwords/arabic new file mode 100644 index 0000000..19c9ad8 --- /dev/null +++ b/stopwords/arabic @@ -0,0 +1,248 @@ +إذ +إذا +إذما +إذن +أف +أقل +أكثر +ألا +إلا +التي +الذي +الذين +اللاتي +اللائي +اللتان +اللتيا +اللتين +اللذان +اللذين +اللواتي +إلى +إليك +إليكم +إليكما +إليكن +أم +أما +أما +إما +أن +إن +إنا +أنا +أنت +أنتم +أنتما +أنتن +إنما +إنه +أنى +أنى +آه +آها +أو +أولاء +أولئك +أوه +آي +أي +أيها +إي +أين +أين +أينما +إيه +بخ +بس +بعد +بعض +بك +بكم +بكم +بكما +بكن +بل +بلى +بما +بماذا +بمن +بنا +به +بها +بهم +بهما +بهن +بي +بين +بيد +تلك +تلكم +تلكما +ته +تي +تين +تينك +ثم +ثمة +حاشا +حبذا +حتى +حيث +حيثما +حين +خلا +دون +ذا +ذات +ذاك +ذان +ذانك +ذلك +ذلكم +ذلكما +ذلكن +ذه +ذو +ذوا +ذواتا +ذواتي +ذي +ذين +ذينك +ريث +سوف +سوى +شتان +عدا +عسى +عل +على +عليك +عليه +عما +عن +عند +غير +فإذا +فإن +فلا +فمن +في +فيم +فيما +فيه +فيها +قد +كأن +كأنما +كأي +كأين +كذا +كذلك +كل +كلا +كلاهما +كلتا +كلما +كليكما +كليهما +كم +كم +كما +كي +كيت +كيف +كيفما +لا +لاسيما +لدى +لست +لستم +لستما +لستن +لسن +لسنا +لعل +لك +لكم +لكما +لكن +لكنما +لكي +لكيلا +لم +لما +لن +لنا +له +لها +لهم +لهما +لهن +لو +لولا +لوما +لي +لئن +ليت +ليس +ليسا +ليست +ليستا +ليسوا +ما +ماذا +متى +مذ +مع +مما +ممن +من +منه +منها +منذ +مه +مهما +نحن +نحو +نعم +ها +هاتان +هاته +هاتي +هاتين +هاك +هاهنا +هذا +هذان +هذه +هذي +هذين +هكذا +هل +هلا +هم +هما +هن +هنا +هناك +هنالك +هو +هؤلاء +هي +هيا +هيت +هيهات +والذي +والذين +وإذ +وإذا +وإن +ولا +ولكن +ولو +وما +ومن +وهو +يا diff --git a/stopwords/azerbaijani b/stopwords/azerbaijani new file mode 100644 index 0000000..27bf294 --- /dev/null +++ b/stopwords/azerbaijani @@ -0,0 +1,165 @@ +a +ad +altı +altmış +amma +arasında +artıq +ay +az +bax +belə +bəli +bəlkə +beş +bəy +bəzən +bəzi +bilər +bir +biraz +biri +birşey +biz +bizim +bizlər +bu +buna +bundan +bunların +bunu +bunun +buradan +bütün +ci +cı +çox +cu +cü +çünki +da +daha +də +dedi +dək +dən +dəqiqə +deyil +dir +doqquz +doqsan +dörd +düz +ə +edən +edir +əgər +əlbəttə +elə +əlli +ən +əslində +et +etdi +etmə +etmək +faiz +gilə +görə +ha +haqqında +harada +hə +heç +həm +həmin +həmişə +hər +ı +idi +iki +il +ildə +ilə +ilk +in +indi +isə +istifadə +iyirmi +ki +kim +kimə +kimi +lakin +lap +məhz +mən +mənə +mirşey +nə +nəhayət +niyə +o +obirisi +of +olan +olar +olaraq +oldu +olduğu +olmadı +olmaz +olmuşdur +olsun +olur +on +ona +ondan +onlar +onlardan +onların +onsuzda +onu +onun +oradan +otuz +öz +özü +qarşı +qədər +qırx +saat +sadəcə +saniyə +səhv +səkkiz +səksən +sən +sənə +sənin +siz +sizin +sizlər +sonra +təəssüf +ü +üç +üçün +var +və +xan +xanım +xeyr +ya +yalnız +yaxşı +yeddi +yenə +yəni +yetmiş +yox +yoxdur +yoxsa +yüz +zaman \ No newline at end of file diff --git a/stopwords/danish b/stopwords/danish new file mode 100644 index 0000000..d3edc67 --- /dev/null +++ b/stopwords/danish @@ -0,0 +1,94 @@ +og +i +jeg +det +at +en +den +til +er +som +på +de +med +han +af +for +ikke +der +var +mig +sig +men +et +har +om +vi +min +havde +ham +hun +nu +over +da +fra +du +ud +sin +dem +os +op +man +hans +hvor +eller +hvad +skal +selv +her +alle +vil +blev +kunne +ind +når +være +dog +noget +ville +jo +deres +efter +ned +skulle +denne +end +dette +mit +også +under +have +dig +anden +hende +mine +alt +meget +sit +sine +vor +mod +disse +hvis +din +nogle +hos +blive +mange +ad +bliver +hendes +været +thi +jer +sådan diff --git a/stopwords/dutch b/stopwords/dutch new file mode 100644 index 0000000..cafa032 --- /dev/null +++ b/stopwords/dutch @@ -0,0 +1,101 @@ +de +en +van +ik +te +dat +die +in +een +hij +het +niet +zijn +is +was +op +aan +met +als +voor +had +er +maar +om +hem +dan +zou +of +wat +mijn +men +dit +zo +door +over +ze +zich +bij +ook +tot +je +mij +uit +der +daar +haar +naar +heb +hoe +heeft +hebben +deze +u +want +nog +zal +me +zij +nu +ge +geen +omdat +iets +worden +toch +al +waren +veel +meer +doen +toen +moet +ben +zonder +kan +hun +dus +alles +onder +ja +eens +hier +wie +werd +altijd +doch +wordt +wezen +kunnen +ons +zelf +tegen +na +reeds +wil +kon +niets +uw +iemand +geweest +andere diff --git a/stopwords/english b/stopwords/english new file mode 100644 index 0000000..1280aa3 --- /dev/null +++ b/stopwords/english @@ -0,0 +1,179 @@ +i +me +my +myself +we +our +ours +ourselves +you +you're +you've +you'll +you'd +your +yours +yourself +yourselves +he +him +his +himself +she +she's +her +hers +herself +it +it's +its +itself +they +them +their +theirs +themselves +what +which +who +whom +this +that +that'll +these +those +am +is +are +was +were +be +been +being +have +has +had +having +do +does +did +doing +a +an +the +and +but +if +or +because +as +until +while +of +at +by +for +with +about +against +between +into +through +during +before +after +above +below +to +from +up +down +in +out +on +off +over +under +again +further +then +once +here +there +when +where +why +how +all +any +both +each +few +more +most +other +some +such +no +nor +not +only +own +same +so +than +too +very +s +t +can +will +just +don +don't +should +should've +now +d +ll +m +o +re +ve +y +ain +aren +aren't +couldn +couldn't +didn +didn't +doesn +doesn't +hadn +hadn't +hasn +hasn't +haven +haven't +isn +isn't +ma +mightn +mightn't +mustn +mustn't +needn +needn't +shan +shan't +shouldn +shouldn't +wasn +wasn't +weren +weren't +won +won't +wouldn +wouldn't diff --git a/stopwords/finnish b/stopwords/finnish new file mode 100644 index 0000000..47ee200 --- /dev/null +++ b/stopwords/finnish @@ -0,0 +1,235 @@ +olla +olen +olet +on +olemme +olette +ovat +ole +oli +olisi +olisit +olisin +olisimme +olisitte +olisivat +olit +olin +olimme +olitte +olivat +ollut +olleet +en +et +ei +emme +ette +eivät +minä +minun +minut +minua +minussa +minusta +minuun +minulla +minulta +minulle +sinä +sinun +sinut +sinua +sinussa +sinusta +sinuun +sinulla +sinulta +sinulle +hän +hänen +hänet +häntä +hänessä +hänestä +häneen +hänellä +häneltä +hänelle +me +meidän +meidät +meitä +meissä +meistä +meihin +meillä +meiltä +meille +te +teidän +teidät +teitä +teissä +teistä +teihin +teillä +teiltä +teille +he +heidän +heidät +heitä +heissä +heistä +heihin +heillä +heiltä +heille +tämä +tämän +tätä +tässä +tästä +tähän +tallä +tältä +tälle +tänä +täksi +tuo +tuon +tuotä +tuossa +tuosta +tuohon +tuolla +tuolta +tuolle +tuona +tuoksi +se +sen +sitä +siinä +siitä +siihen +sillä +siltä +sille +sinä +siksi +nämä +näiden +näitä +näissä +näistä +näihin +näillä +näiltä +näille +näinä +näiksi +nuo +noiden +noita +noissa +noista +noihin +noilla +noilta +noille +noina +noiksi +ne +niiden +niitä +niissä +niistä +niihin +niillä +niiltä +niille +niinä +niiksi +kuka +kenen +kenet +ketä +kenessä +kenestä +keneen +kenellä +keneltä +kenelle +kenenä +keneksi +ketkä +keiden +ketkä +keitä +keissä +keistä +keihin +keillä +keiltä +keille +keinä +keiksi +mikä +minkä +minkä +mitä +missä +mistä +mihin +millä +miltä +mille +minä +miksi +mitkä +joka +jonka +jota +jossa +josta +johon +jolla +jolta +jolle +jona +joksi +jotka +joiden +joita +joissa +joista +joihin +joilla +joilta +joille +joina +joiksi +että +ja +jos +koska +kuin +mutta +niin +sekä +sillä +tai +vaan +vai +vaikka +kanssa +mukaan +noin +poikki +yli +kun +niin +nyt +itse diff --git a/stopwords/french b/stopwords/french new file mode 100644 index 0000000..00af587 --- /dev/null +++ b/stopwords/french @@ -0,0 +1,157 @@ +au +aux +avec +ce +ces +dans +de +des +du +elle +en +et +eux +il +ils +je +la +le +les +leur +lui +ma +mais +me +même +mes +moi +mon +ne +nos +notre +nous +on +ou +par +pas +pour +qu +que +qui +sa +se +ses +son +sur +ta +te +tes +toi +ton +tu +un +une +vos +votre +vous +c +d +j +l +à +m +n +s +t +y +été +étée +étées +étés +étant +étante +étants +étantes +suis +es +est +sommes +êtes +sont +serai +seras +sera +serons +serez +seront +serais +serait +serions +seriez +seraient +étais +était +étions +étiez +étaient +fus +fut +fûmes +fûtes +furent +sois +soit +soyons +soyez +soient +fusse +fusses +fût +fussions +fussiez +fussent +ayant +ayante +ayantes +ayants +eu +eue +eues +eus +ai +as +avons +avez +ont +aurai +auras +aura +aurons +aurez +auront +aurais +aurait +aurions +auriez +auraient +avais +avait +avions +aviez +avaient +eut +eûmes +eûtes +eurent +aie +aies +ait +ayons +ayez +aient +eusse +eusses +eût +eussions +eussiez +eussent diff --git a/stopwords/german b/stopwords/german new file mode 100644 index 0000000..c2241d0 --- /dev/null +++ b/stopwords/german @@ -0,0 +1,232 @@ +aber +alle +allem +allen +aller +alles +als +also +am +an +ander +andere +anderem +anderen +anderer +anderes +anderm +andern +anderr +anders +auch +auf +aus +bei +bin +bis +bist +da +damit +dann +der +den +des +dem +die +das +dass +daß +derselbe +derselben +denselben +desselben +demselben +dieselbe +dieselben +dasselbe +dazu +dein +deine +deinem +deinen +deiner +deines +denn +derer +dessen +dich +dir +du +dies +diese +diesem +diesen +dieser +dieses +doch +dort +durch +ein +eine +einem +einen +einer +eines +einig +einige +einigem +einigen +einiger +einiges +einmal +er +ihn +ihm +es +etwas +euer +eure +eurem +euren +eurer +eures +für +gegen +gewesen +hab +habe +haben +hat +hatte +hatten +hier +hin +hinter +ich +mich +mir +ihr +ihre +ihrem +ihren +ihrer +ihres +euch +im +in +indem +ins +ist +jede +jedem +jeden +jeder +jedes +jene +jenem +jenen +jener +jenes +jetzt +kann +kein +keine +keinem +keinen +keiner +keines +können +könnte +machen +man +manche +manchem +manchen +mancher +manches +mein +meine +meinem +meinen +meiner +meines +mit +muss +musste +nach +nicht +nichts +noch +nun +nur +ob +oder +ohne +sehr +sein +seine +seinem +seinen +seiner +seines +selbst +sich +sie +ihnen +sind +so +solche +solchem +solchen +solcher +solches +soll +sollte +sondern +sonst +über +um +und +uns +unsere +unserem +unseren +unser +unseres +unter +viel +vom +von +vor +während +war +waren +warst +was +weg +weil +weiter +welche +welchem +welchen +welcher +welches +wenn +werde +werden +wie +wieder +will +wir +wird +wirst +wo +wollen +wollte +würde +würden +zu +zum +zur +zwar +zwischen diff --git a/stopwords/greek b/stopwords/greek new file mode 100644 index 0000000..9d08b14 --- /dev/null +++ b/stopwords/greek @@ -0,0 +1,265 @@ +αλλα +αν +αντι +απο +αυτα +αυτεσ +αυτη +αυτο +αυτοι +αυτοσ +αυτουσ +αυτων +αἱ +αἳ +αἵ +αὐτόσ +αὐτὸς +αὖ +γάρ +γα +γα^ +γε +για +γοῦν +γὰρ +δ' +δέ +δή +δαί +δαίσ +δαὶ +δαὶς +δε +δεν +δι' +διά +διὰ +δὲ +δὴ +δ’ +εαν +ειμαι +ειμαστε +ειναι +εισαι +ειστε +εκεινα +εκεινεσ +εκεινη +εκεινο +εκεινοι +εκεινοσ +εκεινουσ +εκεινων +ενω +επ +επι +εἰ +εἰμί +εἰμὶ +εἰς +εἰσ +εἴ +εἴμι +εἴτε +η +θα +ισωσ +κ +καί +καίτοι +καθ +και +κατ +κατά +κατα +κατὰ +καὶ +κι +κἀν +κἂν +μέν +μή +μήτε +μα +με +μεθ +μετ +μετά +μετα +μετὰ +μη +μην +μἐν +μὲν +μὴ +μὴν +να +ο +οι +ομωσ +οπωσ +οσο +οτι +οἱ +οἳ +οἷς +οὐ +οὐδ +οὐδέ +οὐδείσ +οὐδεὶς +οὐδὲ +οὐδὲν +οὐκ +οὐχ +οὐχὶ +οὓς +οὔτε +οὕτω +οὕτως +οὕτωσ +οὖν +οὗ +οὗτος +οὗτοσ +παρ +παρά +παρα +παρὰ +περί +περὶ +ποια +ποιεσ +ποιο +ποιοι +ποιοσ +ποιουσ +ποιων +ποτε +που +ποῦ +προ +προσ +πρόσ +πρὸ +πρὸς +πως +πωσ +σε +στη +στην +στο +στον +σόσ +σύ +σύν +σὸς +σὺ +σὺν +τά +τήν +τί +τίς +τίσ +τα +ταῖς +τε +την +τησ +τι +τινα +τις +τισ +το +τοί +τοι +τοιοῦτος +τοιοῦτοσ +τον +τοτε +του +τούσ +τοὺς +τοῖς +τοῦ +των +τό +τόν +τότε +τὰ +τὰς +τὴν +τὸ +τὸν +τῆς +τῆσ +τῇ +τῶν +τῷ +ωσ +ἀλλ' +ἀλλά +ἀλλὰ +ἀλλ’ +ἀπ +ἀπό +ἀπὸ +ἀφ +ἂν +ἃ +ἄλλος +ἄλλοσ +ἄν +ἄρα +ἅμα +ἐάν +ἐγώ +ἐγὼ +ἐκ +ἐμόσ +ἐμὸς +ἐν +ἐξ +ἐπί +ἐπεὶ +ἐπὶ +ἐστι +ἐφ +ἐὰν +ἑαυτοῦ +ἔτι +ἡ +ἢ +ἣ +ἤ +ἥ +ἧς +ἵνα +ὁ +ὃ +ὃν +ὃς +ὅ +ὅδε +ὅθεν +ὅπερ +ὅς +ὅσ +ὅστις +ὅστισ +ὅτε +ὅτι +ὑμόσ +ὑπ +ὑπέρ +ὑπό +ὑπὲρ +ὑπὸ +ὡς +ὡσ +ὥς +ὥστε +ὦ +ᾧ diff --git a/stopwords/hungarian b/stopwords/hungarian new file mode 100644 index 0000000..94e9f9a --- /dev/null +++ b/stopwords/hungarian @@ -0,0 +1,199 @@ +a +ahogy +ahol +aki +akik +akkor +alatt +által +általában +amely +amelyek +amelyekben +amelyeket +amelyet +amelynek +ami +amit +amolyan +amíg +amikor +át +abban +ahhoz +annak +arra +arról +az +azok +azon +azt +azzal +azért +aztán +azután +azonban +bár +be +belül +benne +cikk +cikkek +cikkeket +csak +de +e +eddig +egész +egy +egyes +egyetlen +egyéb +egyik +egyre +ekkor +el +elég +ellen +elõ +elõször +elõtt +elsõ +én +éppen +ebben +ehhez +emilyen +ennek +erre +ez +ezt +ezek +ezen +ezzel +ezért +és +fel +felé +hanem +hiszen +hogy +hogyan +igen +így +illetve +ill. +ill +ilyen +ilyenkor +ison +ismét +itt +jó +jól +jobban +kell +kellett +keresztül +keressünk +ki +kívül +között +közül +legalább +lehet +lehetett +legyen +lenne +lenni +lesz +lett +maga +magát +majd +majd +már +más +másik +meg +még +mellett +mert +mely +melyek +mi +mit +míg +miért +milyen +mikor +minden +mindent +mindenki +mindig +mint +mintha +mivel +most +nagy +nagyobb +nagyon +ne +néha +nekem +neki +nem +néhány +nélkül +nincs +olyan +ott +össze +õ +õk +õket +pedig +persze +rá +s +saját +sem +semmi +sok +sokat +sokkal +számára +szemben +szerint +szinte +talán +tehát +teljes +tovább +továbbá +több +úgy +ugyanis +új +újabb +újra +után +utána +utolsó +vagy +vagyis +valaki +valami +valamint +való +vagyok +van +vannak +volt +voltam +voltak +voltunk +vissza +vele +viszont +volna diff --git a/stopwords/indonesian b/stopwords/indonesian new file mode 100644 index 0000000..bf88a45 --- /dev/null +++ b/stopwords/indonesian @@ -0,0 +1,758 @@ +ada +adalah +adanya +adapun +agak +agaknya +agar +akan +akankah +akhir +akhiri +akhirnya +aku +akulah +amat +amatlah +anda +andalah +antar +antara +antaranya +apa +apaan +apabila +apakah +apalagi +apatah +artinya +asal +asalkan +atas +atau +ataukah +ataupun +awal +awalnya +bagai +bagaikan +bagaimana +bagaimanakah +bagaimanapun +bagi +bagian +bahkan +bahwa +bahwasanya +baik +bakal +bakalan +balik +banyak +bapak +baru +bawah +beberapa +begini +beginian +beginikah +beginilah +begitu +begitukah +begitulah +begitupun +bekerja +belakang +belakangan +belum +belumlah +benar +benarkah +benarlah +berada +berakhir +berakhirlah +berakhirnya +berapa +berapakah +berapalah +berapapun +berarti +berawal +berbagai +berdatangan +beri +berikan +berikut +berikutnya +berjumlah +berkali-kali +berkata +berkehendak +berkeinginan +berkenaan +berlainan +berlalu +berlangsung +berlebihan +bermacam +bermacam-macam +bermaksud +bermula +bersama +bersama-sama +bersiap +bersiap-siap +bertanya +bertanya-tanya +berturut +berturut-turut +bertutur +berujar +berupa +besar +betul +betulkah +biasa +biasanya +bila +bilakah +bisa +bisakah +boleh +bolehkah +bolehlah +buat +bukan +bukankah +bukanlah +bukannya +bulan +bung +cara +caranya +cukup +cukupkah +cukuplah +cuma +dahulu +dalam +dan +dapat +dari +daripada +datang +dekat +demi +demikian +demikianlah +dengan +depan +di +dia +diakhiri +diakhirinya +dialah +diantara +diantaranya +diberi +diberikan +diberikannya +dibuat +dibuatnya +didapat +didatangkan +digunakan +diibaratkan +diibaratkannya +diingat +diingatkan +diinginkan +dijawab +dijelaskan +dijelaskannya +dikarenakan +dikatakan +dikatakannya +dikerjakan +diketahui +diketahuinya +dikira +dilakukan +dilalui +dilihat +dimaksud +dimaksudkan +dimaksudkannya +dimaksudnya +diminta +dimintai +dimisalkan +dimulai +dimulailah +dimulainya +dimungkinkan +dini +dipastikan +diperbuat +diperbuatnya +dipergunakan +diperkirakan +diperlihatkan +diperlukan +diperlukannya +dipersoalkan +dipertanyakan +dipunyai +diri +dirinya +disampaikan +disebut +disebutkan +disebutkannya +disini +disinilah +ditambahkan +ditandaskan +ditanya +ditanyai +ditanyakan +ditegaskan +ditujukan +ditunjuk +ditunjuki +ditunjukkan +ditunjukkannya +ditunjuknya +dituturkan +dituturkannya +diucapkan +diucapkannya +diungkapkan +dong +dua +dulu +empat +enggak +enggaknya +entah +entahlah +guna +gunakan +hal +hampir +hanya +hanyalah +hari +harus +haruslah +harusnya +hendak +hendaklah +hendaknya +hingga +ia +ialah +ibarat +ibaratkan +ibaratnya +ibu +ikut +ingat +ingat-ingat +ingin +inginkah +inginkan +ini +inikah +inilah +itu +itukah +itulah +jadi +jadilah +jadinya +jangan +jangankan +janganlah +jauh +jawab +jawaban +jawabnya +jelas +jelaskan +jelaslah +jelasnya +jika +jikalau +juga +jumlah +jumlahnya +justru +kala +kalau +kalaulah +kalaupun +kalian +kami +kamilah +kamu +kamulah +kan +kapan +kapankah +kapanpun +karena +karenanya +kasus +kata +katakan +katakanlah +katanya +ke +keadaan +kebetulan +kecil +kedua +keduanya +keinginan +kelamaan +kelihatan +kelihatannya +kelima +keluar +kembali +kemudian +kemungkinan +kemungkinannya +kenapa +kepada +kepadanya +kesampaian +keseluruhan +keseluruhannya +keterlaluan +ketika +khususnya +kini +kinilah +kira +kira-kira +kiranya +kita +kitalah +kok +kurang +lagi +lagian +lah +lain +lainnya +lalu +lama +lamanya +lanjut +lanjutnya +lebih +lewat +lima +luar +macam +maka +makanya +makin +malah +malahan +mampu +mampukah +mana +manakala +manalagi +masa +masalah +masalahnya +masih +masihkah +masing +masing-masing +mau +maupun +melainkan +melakukan +melalui +melihat +melihatnya +memang +memastikan +memberi +memberikan +membuat +memerlukan +memihak +meminta +memintakan +memisalkan +memperbuat +mempergunakan +memperkirakan +memperlihatkan +mempersiapkan +mempersoalkan +mempertanyakan +mempunyai +memulai +memungkinkan +menaiki +menambahkan +menandaskan +menanti +menanti-nanti +menantikan +menanya +menanyai +menanyakan +mendapat +mendapatkan +mendatang +mendatangi +mendatangkan +menegaskan +mengakhiri +mengapa +mengatakan +mengatakannya +mengenai +mengerjakan +mengetahui +menggunakan +menghendaki +mengibaratkan +mengibaratkannya +mengingat +mengingatkan +menginginkan +mengira +mengucapkan +mengucapkannya +mengungkapkan +menjadi +menjawab +menjelaskan +menuju +menunjuk +menunjuki +menunjukkan +menunjuknya +menurut +menuturkan +menyampaikan +menyangkut +menyatakan +menyebutkan +menyeluruh +menyiapkan +merasa +mereka +merekalah +merupakan +meski +meskipun +meyakini +meyakinkan +minta +mirip +misal +misalkan +misalnya +mula +mulai +mulailah +mulanya +mungkin +mungkinkah +nah +naik +namun +nanti +nantinya +nyaris +nyatanya +oleh +olehnya +pada +padahal +padanya +pak +paling +panjang +pantas +para +pasti +pastilah +penting +pentingnya +per +percuma +perlu +perlukah +perlunya +pernah +persoalan +pertama +pertama-tama +pertanyaan +pertanyakan +pihak +pihaknya +pukul +pula +pun +punya +rasa +rasanya +rata +rupanya +saat +saatnya +saja +sajalah +saling +sama +sama-sama +sambil +sampai +sampai-sampai +sampaikan +sana +sangat +sangatlah +satu +saya +sayalah +se +sebab +sebabnya +sebagai +sebagaimana +sebagainya +sebagian +sebaik +sebaik-baiknya +sebaiknya +sebaliknya +sebanyak +sebegini +sebegitu +sebelum +sebelumnya +sebenarnya +seberapa +sebesar +sebetulnya +sebisanya +sebuah +sebut +sebutlah +sebutnya +secara +secukupnya +sedang +sedangkan +sedemikian +sedikit +sedikitnya +seenaknya +segala +segalanya +segera +seharusnya +sehingga +seingat +sejak +sejauh +sejenak +sejumlah +sekadar +sekadarnya +sekali +sekali-kali +sekalian +sekaligus +sekalipun +sekarang +sekarang +sekecil +seketika +sekiranya +sekitar +sekitarnya +sekurang-kurangnya +sekurangnya +sela +selain +selaku +selalu +selama +selama-lamanya +selamanya +selanjutnya +seluruh +seluruhnya +semacam +semakin +semampu +semampunya +semasa +semasih +semata +semata-mata +semaunya +sementara +semisal +semisalnya +sempat +semua +semuanya +semula +sendiri +sendirian +sendirinya +seolah +seolah-olah +seorang +sepanjang +sepantasnya +sepantasnyalah +seperlunya +seperti +sepertinya +sepihak +sering +seringnya +serta +serupa +sesaat +sesama +sesampai +sesegera +sesekali +seseorang +sesuatu +sesuatunya +sesudah +sesudahnya +setelah +setempat +setengah +seterusnya +setiap +setiba +setibanya +setidak-tidaknya +setidaknya +setinggi +seusai +sewaktu +siap +siapa +siapakah +siapapun +sini +sinilah +soal +soalnya +suatu +sudah +sudahkah +sudahlah +supaya +tadi +tadinya +tahu +tahun +tak +tambah +tambahnya +tampak +tampaknya +tandas +tandasnya +tanpa +tanya +tanyakan +tanyanya +tapi +tegas +tegasnya +telah +tempat +tengah +tentang +tentu +tentulah +tentunya +tepat +terakhir +terasa +terbanyak +terdahulu +terdapat +terdiri +terhadap +terhadapnya +teringat +teringat-ingat +terjadi +terjadilah +terjadinya +terkira +terlalu +terlebih +terlihat +termasuk +ternyata +tersampaikan +tersebut +tersebutlah +tertentu +tertuju +terus +terutama +tetap +tetapi +tiap +tiba +tiba-tiba +tidak +tidakkah +tidaklah +tiga +tinggi +toh +tunjuk +turut +tutur +tuturnya +ucap +ucapnya +ujar +ujarnya +umum +umumnya +ungkap +ungkapnya +untuk +usah +usai +waduh +wah +wahai +waktu +waktunya +walau +walaupun +wong +yaitu +yakin +yakni +yang \ No newline at end of file diff --git a/stopwords/italian b/stopwords/italian new file mode 100644 index 0000000..6ee02b5 --- /dev/null +++ b/stopwords/italian @@ -0,0 +1,279 @@ +ad +al +allo +ai +agli +all +agl +alla +alle +con +col +coi +da +dal +dallo +dai +dagli +dall +dagl +dalla +dalle +di +del +dello +dei +degli +dell +degl +della +delle +in +nel +nello +nei +negli +nell +negl +nella +nelle +su +sul +sullo +sui +sugli +sull +sugl +sulla +sulle +per +tra +contro +io +tu +lui +lei +noi +voi +loro +mio +mia +miei +mie +tuo +tua +tuoi +tue +suo +sua +suoi +sue +nostro +nostra +nostri +nostre +vostro +vostra +vostri +vostre +mi +ti +ci +vi +lo +la +li +le +gli +ne +il +un +uno +una +ma +ed +se +perché +anche +come +dov +dove +che +chi +cui +non +più +quale +quanto +quanti +quanta +quante +quello +quelli +quella +quelle +questo +questi +questa +queste +si +tutto +tutti +a +c +e +i +l +o +ho +hai +ha +abbiamo +avete +hanno +abbia +abbiate +abbiano +avrò +avrai +avrà +avremo +avrete +avranno +avrei +avresti +avrebbe +avremmo +avreste +avrebbero +avevo +avevi +aveva +avevamo +avevate +avevano +ebbi +avesti +ebbe +avemmo +aveste +ebbero +avessi +avesse +avessimo +avessero +avendo +avuto +avuta +avuti +avute +sono +sei +è +siamo +siete +sia +siate +siano +sarò +sarai +sarà +saremo +sarete +saranno +sarei +saresti +sarebbe +saremmo +sareste +sarebbero +ero +eri +era +eravamo +eravate +erano +fui +fosti +fu +fummo +foste +furono +fossi +fosse +fossimo +fossero +essendo +faccio +fai +facciamo +fanno +faccia +facciate +facciano +farò +farai +farà +faremo +farete +faranno +farei +faresti +farebbe +faremmo +fareste +farebbero +facevo +facevi +faceva +facevamo +facevate +facevano +feci +facesti +fece +facemmo +faceste +fecero +facessi +facesse +facessimo +facessero +facendo +sto +stai +sta +stiamo +stanno +stia +stiate +stiano +starò +starai +starà +staremo +starete +staranno +starei +staresti +starebbe +staremmo +stareste +starebbero +stavo +stavi +stava +stavamo +stavate +stavano +stetti +stesti +stette +stemmo +steste +stettero +stessi +stesse +stessimo +stessero +stando diff --git a/stopwords/kazakh b/stopwords/kazakh new file mode 100644 index 0000000..ebb9fc1 --- /dev/null +++ b/stopwords/kazakh @@ -0,0 +1,380 @@ +ах +ох +эх +ай +эй +ой +тағы +тағыда +әрине +жоқ +сондай +осындай +осылай +солай +мұндай +бұндай +мен +сен +ол +біз +біздер +олар +сіз +сіздер +маған +оған +саған +біздің +сіздің +оның +бізге +сізге +оларға +біздерге +сіздерге +оларға +менімен +сенімен +онымен +бізбен +сізбен +олармен +біздермен +сіздермен +менің +сенің +біздің +сіздің +оның +біздердің +сіздердің +олардың +маған +саған +оған +менен +сенен +одан +бізден +сізден +олардан +біздерден +сіздерден +олардан +айтпақшы +сонымен +сондықтан +бұл +осы +сол +анау +мынау +сонау +осынау +ана +мына +сона +әні +міне +өй +үйт +бүйт +біреу +кейбіреу +кейбір +қайсыбір +әрбір +бірнеше +бірдеме +бірнеше +әркім +әрне +әрқайсы +әрқалай +әлдекім +әлдене +әлдеқайдан +әлденеше +әлдеқалай +әлдеқашан +алдақашан +еш +ешкім +ешбір +ештеме +дәнеңе +ешқашан +ешқандай +ешқайсы +емес +бәрі +барлық +барша +бар +күллі +бүкіл +түгел +өз +өзім +өзің +өзінің +өзіме +өзіне +өзімнің +өзі +өзге +менде +сенде +онда +менен +сенен онан +одан +ау +па +ей +әй +е +уа +уау +уай +я +пай +ә +о +оһо +ой +ие +аһа +ау +беу +мәссаған +бәрекелді +әттегенай +жаракімалла +масқарай +астапыралла +япырмай +ойпырмай +кәне +кәнеки +ал +әйда +кәні +міне +әні +сорап +қош-қош +пфша +пішә +құрау-құрау +шәйт +шек +моһ +тәк +құрау +құр +кә +кәһ +күшім +күшім +мышы +пырс +әукім +алақай +паһ-паһ +бәрекелді +ура +әттең +әттеген-ай +қап +түге +пішту +шіркін +алатау +пай-пай +үшін +сайын +сияқты +туралы +арқылы +бойы +бойымен +шамалы +шақты +қаралы +ғұрлы +ғұрлым +шейін +дейін +қарай +таман +салым +тарта +жуық +таяу +гөрі +бері +кейін +соң +бұрын +бетер +қатар +бірге +қоса +арс + +гүрс + +дүрс + +қорс + +тарс + +тырс + +ырс + +барқ + +борт + +күрт + +кірт + +морт + +сарт + +шырт + +дүңк + +күңк + +қыңқ + +мыңқ + +маңқ + +саңқ + +шаңқ + +шіңк + +сыңқ + +таңқ + +тыңқ + +ыңқ + +болп + +былп + +жалп + +желп + +қолп + +ірк + +ырқ + +сарт-сұрт + +тарс-тұрс + +арс-ұрс + +жалт-жалт + +жалт-жұлт + +қалт-қалт + +қалт-құлт + +қаңқ-қаңқ + +қаңқ-құңқ + +шаңқ-шаңқ + +шаңқ-шұңқ + +арбаң-арбаң + +бүгжең-бүгжең + +арсалаң-арсалаң + +ербелең-ербелең + +батыр-бұтыр + +далаң-далаң + +тарбаң-тарбаң + +қызараң-қызараң + +қаңғыр-күңгір + +қайқаң-құйқаң + +митың-митың + +салаң-сұлаң + +ыржың-тыржың +бірақ +алайда +дегенмен +әйтпесе +әйткенмен +себебі +өйткені +сондықтан +үшін +сайын +сияқты +туралы +арқылы +бойы +бойымен +шамалы +шақты +қаралы +ғұрлы +ғұрлым +гөрі +бері +кейін +соң +бұрын +бетер +қатар +бірге +қоса +шейін +дейін +қарай +таман +салым +тарта +жуық +таяу +арнайы +осындай +ғана +қана +тек +әншейін diff --git a/stopwords/nepali b/stopwords/nepali new file mode 100644 index 0000000..b2e4d34 --- /dev/null +++ b/stopwords/nepali @@ -0,0 +1,255 @@ +छ +र +पनि +छन् +लागि +भएको +गरेको +भने +गर्न +गर्ने +हो +तथा +यो +रहेको +उनले +थियो +हुने +गरेका +थिए +गर्दै +तर +नै +को +मा +हुन् +भन्ने +हुन +गरी +त +हुन्छ +अब +के +रहेका +गरेर +छैन +दिए +भए +यस +ले +गर्नु +औं +सो +त्यो +कि +जुन +यी +का +गरि +ती +न +छु +छौं +लाई +नि +उप +अक्सर +आदि +कसरी +क्रमशः +चाले +अगाडी +अझै +अनुसार +अन्तर्गत +अन्य +अन्यत्र +अन्यथा +अरु +अरुलाई +अर्को +अर्थात +अर्थात् +अलग +आए +आजको +ओठ +आत्म +आफू +आफूलाई +आफ्नै +आफ्नो +आयो +उदाहरण +उनको +उहालाई +एउटै +एक +एकदम +कतै +कम से कम +कसै +कसैले +कहाँबाट +कहिलेकाहीं +का +किन +किनभने +कुनै +कुरा +कृपया +केही +कोही +गए +गरौं +गर्छ +गर्छु +गर्नुपर्छ +गयौ +गैर +चार +चाहनुहुन्छ +चाहन्छु +चाहिए +छू +जताततै +जब +जबकि +जसको +जसबाट +जसमा +जसलाई +जसले +जस्तै +जस्तो +जस्तोसुकै +जहाँ +जान +जाहिर +जे +जो +ठीक +तत्काल +तदनुसार +तपाईको +तपाई +पर्याप्त +पहिले +पहिलो +पहिल्यै +पाँच +पाँचौं +तल +तापनी +तिनी +तिनीहरू +तिनीहरुको +तिनिहरुलाई +तिमी +तिर +तीन +तुरुन्तै +तेस्रो +तेस्कारण +पूर्व +प्रति +प्रतेक +प्लस +फेरी +बने +त्सपछि +त्सैले +त्यहाँ +थिएन +दिनुभएको +दिनुहुन्छ +दुई +देखि +बरु +बारे +बाहिर +देखिन्छ +देखियो +देखे +देखेको +देखेर +दोस्रो +धेरै +नजिकै +नत्र +नयाँ +निम्ति +बाहेक +बीच +बीचमा +भन +निम्न +निम्नानुसार +निर्दिष्ट +नौ +पक्का +पक्कै +पछि +पछिल्लो +पटक +पर्छ +पर्थ्यो +भन्छन् +भन् +भन्छु +भन्दा +भन्नुभयो +भर +भित्र +भित्री +म +मलाई +मात्र +माथि +मुख्य +मेरो +यति +यथोचित +यदि +यद्यपि +यसको +यसपछि +यसबाहेक +यसरी +यसो +यस्तो +यहाँ +यहाँसम्म +या +रही +राखे +राख्छ +राम्रो +रूप +लगभग +वरीपरी +वास्तवमा +बिरुद्ध +बिशेष +सायद +शायद +संग +संगै +सक्छ +सट्टा +सधै +सबै +सबैलाई +समय +सम्भव +सम्म +सही +साँच्चै +सात +साथ +साथै +सारा +सोही +स्पष्ट +हरे +हरेक \ No newline at end of file diff --git a/stopwords/norwegian b/stopwords/norwegian new file mode 100644 index 0000000..9ac1abb --- /dev/null +++ b/stopwords/norwegian @@ -0,0 +1,176 @@ +og +i +jeg +det +at +en +et +den +til +er +som +på +de +med +han +av +ikke +ikkje +der +så +var +meg +seg +men +ett +har +om +vi +min +mitt +ha +hadde +hun +nå +over +da +ved +fra +du +ut +sin +dem +oss +opp +man +kan +hans +hvor +eller +hva +skal +selv +sjøl +her +alle +vil +bli +ble +blei +blitt +kunne +inn +når +være +kom +noen +noe +ville +dere +som +deres +kun +ja +etter +ned +skulle +denne +for +deg +si +sine +sitt +mot +å +meget +hvorfor +dette +disse +uten +hvordan +ingen +din +ditt +blir +samme +hvilken +hvilke +sånn +inni +mellom +vår +hver +hvem +vors +hvis +både +bare +enn +fordi +før +mange +også +slik +vært +være +båe +begge +siden +dykk +dykkar +dei +deira +deires +deim +di +då +eg +ein +eit +eitt +elles +honom +hjå +ho +hoe +henne +hennar +hennes +hoss +hossen +ikkje +ingi +inkje +korleis +korso +kva +kvar +kvarhelst +kven +kvi +kvifor +me +medan +mi +mine +mykje +no +nokon +noka +nokor +noko +nokre +si +sia +sidan +so +somt +somme +um +upp +vere +vore +verte +vort +varte +vart diff --git a/stopwords/portuguese b/stopwords/portuguese new file mode 100644 index 0000000..c359479 --- /dev/null +++ b/stopwords/portuguese @@ -0,0 +1,204 @@ +de +a +o +que +e +é +do +da +em +um +para +com +não +uma +os +no +se +na +por +mais +as +dos +como +mas +ao +ele +das +à +seu +sua +ou +quando +muito +nos +já +eu +também +só +pelo +pela +até +isso +ela +entre +depois +sem +mesmo +aos +seus +quem +nas +me +esse +eles +você +essa +num +nem +suas +meu +às +minha +numa +pelos +elas +qual +nós +lhe +deles +essas +esses +pelas +este +dele +tu +te +vocês +vos +lhes +meus +minhas +teu +tua +teus +tuas +nosso +nossa +nossos +nossas +dela +delas +esta +estes +estas +aquele +aquela +aqueles +aquelas +isto +aquilo +estou +está +estamos +estão +estive +esteve +estivemos +estiveram +estava +estávamos +estavam +estivera +estivéramos +esteja +estejamos +estejam +estivesse +estivéssemos +estivessem +estiver +estivermos +estiverem +hei +há +havemos +hão +houve +houvemos +houveram +houvera +houvéramos +haja +hajamos +hajam +houvesse +houvéssemos +houvessem +houver +houvermos +houverem +houverei +houverá +houveremos +houverão +houveria +houveríamos +houveriam +sou +somos +são +era +éramos +eram +fui +foi +fomos +foram +fora +fôramos +seja +sejamos +sejam +fosse +fôssemos +fossem +for +formos +forem +serei +será +seremos +serão +seria +seríamos +seriam +tenho +tem +temos +tém +tinha +tínhamos +tinham +tive +teve +tivemos +tiveram +tivera +tivéramos +tenha +tenhamos +tenham +tivesse +tivéssemos +tivessem +tiver +tivermos +tiverem +terei +terá +teremos +terão +teria +teríamos +teriam diff --git a/stopwords/romanian b/stopwords/romanian new file mode 100644 index 0000000..45651c9 --- /dev/null +++ b/stopwords/romanian @@ -0,0 +1,356 @@ +a +abia +acea +aceasta +această +aceea +aceeasi +acei +aceia +acel +acela +acelasi +acele +acelea +acest +acesta +aceste +acestea +acestei +acestia +acestui +aceşti +aceştia +adica +ai +aia +aibă +aici +al +ala +ale +alea +alt +alta +altceva +altcineva +alte +altfel +alti +altii +altul +am +anume +apoi +ar +are +as +asa +asta +astea +astfel +asupra +atare +atat +atata +atatea +atatia +ati +atit +atita +atitea +atitia +atunci +au +avea +avem +aveţi +avut +aş +aţi +ba +ca +cam +cand +care +careia +carora +caruia +cat +catre +ce +cea +ceea +cei +ceilalti +cel +cele +celor +ceva +chiar +ci +cind +cine +cineva +cit +cita +cite +citeva +citi +citiva +cu +cui +cum +cumva +cât +câte +câtva +câţi +cînd +cît +cîte +cîtva +cîţi +că +căci +cărei +căror +cărui +către +da +daca +dacă +dar +dat +dată +dau +de +deasupra +deci +decit +deja +desi +despre +deşi +din +dintr +dintr- +dintre +doar +doi +doilea +două +drept +dupa +după +dă +e +ea +ei +el +ele +era +eram +este +eu +eşti +face +fara +fata +fel +fi +fie +fiecare +fii +fim +fiu +fiţi +foarte +fost +fără +i +ia +iar +ii +il +imi +in +inainte +inapoi +inca +incit +insa +intr +intre +isi +iti +la +le +li +lor +lui +lângă +lîngă +m +ma +mai +mea +mei +mele +mereu +meu +mi +mie +mine +mod +mult +multa +multe +multi +multă +mulţi +mâine +mîine +mă +ne +ni +nici +nimeni +nimic +niste +nişte +noastre +noastră +noi +nostri +nostru +nou +noua +nouă +noştri +nu +numai +o +or +ori +oricare +orice +oricine +oricum +oricând +oricât +oricînd +oricît +oriunde +pai +parca +patra +patru +pe +pentru +peste +pic +pina +poate +pot +prea +prima +primul +prin +printr- +putini +puţin +puţina +puţină +până +pînă +sa +sa-mi +sa-ti +sai +sale +sau +se +si +sint +sintem +spate +spre +sub +sunt +suntem +sunteţi +sus +să +săi +său +t +ta +tale +te +ti +tine +toata +toate +toată +tocmai +tot +toti +totul +totusi +totuşi +toţi +trei +treia +treilea +tu +tuturor +tăi +tău +u +ul +ului +un +una +unde +undeva +unei +uneia +unele +uneori +unii +unor +unora +unu +unui +unuia +unul +v +va +vi +voastre +voastră +voi +vom +vor +vostru +vouă +voştri +vreo +vreun +vă +zi +zice +îi +îl +îmi +în +îţi +ăla +ălea +ăsta +ăstea +ăştia +şi +ţi +ţie \ No newline at end of file diff --git a/stopwords/russian b/stopwords/russian new file mode 100644 index 0000000..ecb83d4 --- /dev/null +++ b/stopwords/russian @@ -0,0 +1,151 @@ +и +в +во +не +что +он +на +я +с +со +как +а +то +все +она +так +его +но +да +ты +к +у +же +вы +за +бы +по +только +ее +мне +было +вот +от +меня +еще +нет +о +из +ему +теперь +когда +даже +ну +вдруг +ли +если +уже +или +ни +быть +был +него +до +вас +нибудь +опять +уж +вам +ведь +там +потом +себя +ничего +ей +может +они +тут +где +есть +надо +ней +для +мы +тебя +их +чем +была +сам +чтоб +без +будто +чего +раз +тоже +себе +под +будет +ж +тогда +кто +этот +того +потому +этого +какой +совсем +ним +здесь +этом +один +почти +мой +тем +чтобы +нее +сейчас +были +куда +зачем +всех +никогда +можно +при +наконец +два +об +другой +хоть +после +над +больше +тот +через +эти +нас +про +всего +них +какая +много +разве +три +эту +моя +впрочем +хорошо +свою +этой +перед +иногда +лучше +чуть +том +нельзя +такой +им +более +всегда +конечно +всю +между diff --git a/stopwords/slovene b/stopwords/slovene new file mode 100644 index 0000000..eb4d1bc --- /dev/null +++ b/stopwords/slovene @@ -0,0 +1,1784 @@ +ali +ampak +bodisi +in +kajti +marveč +namreč +ne +niti +oziroma +pa +saj +sicer +temveč +ter +toda +torej +vendar +vendarle +zakaj +če +čeprav +čeravno +četudi +čim +da +kadar +kakor +ker +ki +ko +kot +naj +najsi +odkar +preden +dve +dvema +dveh +šest +šestdeset +šestindvajset +šestintrideset +šestnajst +šeststo +štiri +štirideset +štiriindvajset +štirinajst +štiristo +deset +devet +devetdeset +devetintrideset +devetnajst +devetsto +dvainšestdeset +dvaindvajset +dvajset +dvanajst +dvesto +enaindvajset +enaintrideset +enajst +nič +osem +osemdeset +oseminštirideset +osemindevetdeset +osemnajst +pet +petdeset +petinštirideset +petindevetdeset +petindvajset +petinosemdeset +petinpetdeset +petinsedemdeset +petintrideset +petnajst +petsto +sedem +sedemdeset +sedeminšestdeset +sedemindvajset +sedeminpetdeset +sedemnajst +sedemsto +sto +tisoč +tri +trideset +triinšestdeset +triindvajset +triinpetdeset +trinajst +tristo +šestdesetim +šestim +šestindvajsetim +šestintridesetim +šestnajstim +šeststotim +štiridesetim +štiriindvajsetim +štirim +štirinajstim +štiristotim +desetim +devetdesetim +devetim +devetintridesetim +devetnajstim +devetstotim +dvainšestdesetim +dvaindvajsetim +dvajsetim +dvanajstim +dvestotim +enaindvajsetim +enaintridesetim +enajstim +osemdesetim +oseminštiridesetim +osemindevetdesetim +osemnajstim +osmim +petdesetim +petim +petinštiridesetim +petindevetdesetim +petindvajsetim +petinosemdesetim +petinpetdesetim +petinsedemdesetim +petintridesetim +petnajstim +petstotim +sedemdesetim +sedeminšestdesetim +sedemindvajsetim +sedeminpetdesetim +sedemnajstim +sedemstotim +sedmim +stotim +tisočim +trem +tridesetim +triinšestdesetim +triindvajsetim +triinpetdesetim +trinajstim +tristotim +šestdesetih +šestih +šestindvajsetih +šestintridesetih +šestnajstih +šeststotih +štiridesetih +štirih +štiriindvajsetih +štirinajstih +štiristotih +desetih +devetdesetih +devetih +devetintridesetih +devetnajstih +devetstotih +dvainšestdesetih +dvaindvajsetih +dvajsetih +dvanajstih +dvestotih +enaindvajsetih +enaintridesetih +enajstih +osemdesetih +oseminštiridesetih +osemindevetdesetih +osemnajstih +osmih +petdesetih +petih +petinštiridesetih +petindevetdesetih +petindvajsetih +petinosemdesetih +petinpetdesetih +petinsedemdesetih +petintridesetih +petnajstih +petstotih +sedemdesetih +sedeminšestdesetih +sedemindvajsetih +sedeminpetdesetih +sedemnajstih +sedemstotih +sedmih +stotih +tisočih +treh +tridesetih +triinšestdesetih +triindvajsetih +triinpetdesetih +trinajstih +tristotih +šestdesetimi +šestimi +šestindvajsetimi +šestintridesetimi +šestnajstimi +šeststotimi +štiridesetimi +štiriindvajsetimi +štirimi +štirinajstimi +štiristotimi +desetimi +devetdesetimi +devetimi +devetintridesetimi +devetnajstimi +devetstotimi +dvainšestdesetimi +dvaindvajsetimi +dvajsetimi +dvanajstimi +dvestotimi +enaindvajsetimi +enaintridesetimi +enajstimi +osemdesetimi +oseminštiridesetimi +osemindevetdesetimi +osemnajstimi +osmimi +petdesetimi +petimi +petinštiridesetimi +petindevetdesetimi +petindvajsetimi +petinosemdesetimi +petinpetdesetimi +petinsedemdesetimi +petintridesetimi +petnajstimi +petstotimi +sedemdesetimi +sedeminšestdesetimi +sedemindvajsetimi +sedeminpetdesetimi +sedemnajstimi +sedemstotimi +sedmimi +stotimi +tisočimi +tremi +tridesetimi +triinšestdesetimi +triindvajsetimi +triinpetdesetimi +trinajstimi +tristotimi +eno +eni +ene +ena +dva +štirje +trije +en +enega +enemu +enim +enem +eden +dvojni +trojni +dvojnima +trojnima +dvojnih +trojnih +dvojne +trojne +dvojnim +trojnim +dvojnimi +trojnimi +dvojno +trojno +dvojna +trojna +dvojnega +trojnega +dvojen +trojen +dvojnemu +trojnemu +dvojnem +trojnem +četrti +šestdeseti +šesti +šestnajsti +štirideseti +štiriindvajseti +štirinajsti +deseti +devetdeseti +deveti +devetnajsti +drugi +dvaindevetdeseti +dvajseti +dvanajsti +dvestoti +enaindvajseti +enajsti +osemdeseti +osemnajsti +osmi +petdeseti +peti +petinštirideseti +petindvajseti +petinosemdeseti +petintrideseti +petnajsti +prvi +sedemdeseti +sedemindvajseti +sedemnajsti +sedmi +stoti +tisoči +tretji +trideseti +triindvajseti +triintrideseti +trinajsti +tristoti +četrtima +šestdesetima +šestima +šestnajstima +štiridesetima +štiriindvajsetima +štirinajstima +desetima +devetdesetima +devetima +devetnajstima +drugima +dvaindevetdesetima +dvajsetima +dvanajstima +dvestotima +enaindvajsetima +enajstima +osemdesetima +osemnajstima +osmima +petdesetima +petima +petinštiridesetima +petindvajsetima +petinosemdesetima +petintridesetima +petnajstima +prvima +sedemdesetima +sedemindvajsetima +sedemnajstima +sedmima +stotima +tisočima +tretjima +tridesetima +triindvajsetima +triintridesetima +trinajstima +tristotima +četrtih +drugih +dvaindevetdesetih +prvih +tretjih +triintridesetih +četrte +šestdesete +šeste +šestnajste +štiridesete +štiriindvajsete +štirinajste +desete +devetdesete +devete +devetnajste +druge +dvaindevetdesete +dvajsete +dvanajste +dvestote +enaindvajsete +enajste +osemdesete +osemnajste +osme +petdesete +pete +petinštiridesete +petindvajsete +petinosemdesete +petintridesete +petnajste +prve +sedemdesete +sedemindvajsete +sedemnajste +sedme +stote +tisoče +tretje +tridesete +triindvajsete +triintridesete +trinajste +tristote +četrtim +drugim +dvaindevetdesetim +prvim +tretjim +triintridesetim +četrtimi +drugimi +dvaindevetdesetimi +prvimi +tretjimi +triintridesetimi +četrto +šestdeseto +šestnajsto +šesto +štirideseto +štiriindvajseto +štirinajsto +deseto +devetdeseto +devetnajsto +deveto +drugo +dvaindevetdeseto +dvajseto +dvanajsto +dvestoto +enaindvajseto +enajsto +osemdeseto +osemnajsto +osmo +petdeseto +petinštirideseto +petindvajseto +petinosemdeseto +petintrideseto +petnajsto +peto +prvo +sedemdeseto +sedemindvajseto +sedemnajsto +sedmo +stoto +tisočo +tretjo +trideseto +triindvajseto +triintrideseto +trinajsto +tristoto +četrta +šesta +šestdeseta +šestnajsta +štirideseta +štiriindvajseta +štirinajsta +deseta +deveta +devetdeseta +devetnajsta +druga +dvaindevetdeseta +dvajseta +dvanajsta +dvestota +enaindvajseta +enajsta +osemdeseta +osemnajsta +osma +peta +petdeseta +petinštirideseta +petindvajseta +petinosemdeseta +petintrideseta +petnajsta +prva +sedemdeseta +sedemindvajseta +sedemnajsta +sedma +stota +tisoča +tretja +trideseta +triindvajseta +triintrideseta +trinajsta +tristota +četrtega +šestdesetega +šestega +šestnajstega +štiridesetega +štiriindvajsetega +štirinajstega +desetega +devetdesetega +devetega +devetnajstega +drugega +dvaindevetdesetega +dvajsetega +dvanajstega +dvestotega +enaindvajsetega +enajstega +osemdesetega +osemnajstega +osmega +petdesetega +petega +petinštiridesetega +petindvajsetega +petinosemdesetega +petintridesetega +petnajstega +prvega +sedemdesetega +sedemindvajsetega +sedemnajstega +sedmega +stotega +tisočega +tretjega +tridesetega +triindvajsetega +triintridesetega +trinajstega +tristotega +četrtemu +šestdesetemu +šestemu +šestnajstemu +štiridesetemu +štiriindvajsetemu +štirinajstemu +desetemu +devetdesetemu +devetemu +devetnajstemu +drugemu +dvaindevetdesetemu +dvajsetemu +dvanajstemu +dvestotemu +enaindvajsetemu +enajstemu +osemdesetemu +osemnajstemu +osmemu +petdesetemu +petemu +petinštiridesetemu +petindvajsetemu +petinosemdesetemu +petintridesetemu +petnajstemu +prvemu +sedemdesetemu +sedemindvajsetemu +sedemnajstemu +sedmemu +stotemu +tisočemu +tretjemu +tridesetemu +triindvajsetemu +triintridesetemu +trinajstemu +tristotemu +četrtem +šestdesetem +šestem +šestnajstem +štiridesetem +štiriindvajsetem +štirinajstem +desetem +devetdesetem +devetem +devetnajstem +drugem +dvaindevetdesetem +dvajsetem +dvanajstem +dvestotem +enaindvajsetem +enajstem +osemdesetem +osemnajstem +osmem +petdesetem +petem +petinštiridesetem +petindvajsetem +petinosemdesetem +petintridesetem +petnajstem +prvem +sedemdesetem +sedemindvajsetem +sedemnajstem +sedmem +stotem +tisočem +tretjem +tridesetem +triindvajsetem +triintridesetem +trinajstem +tristotem +deseteri +dvakratni +dvoji +enkratni +peteri +stoteri +tisočeri +trikratni +troji +deseterima +dvakratnima +dvojima +enkratnima +peterima +stoterima +tisočerima +trikratnima +trojima +deseterih +dvakratnih +dvojih +enkratnih +peterih +stoterih +tisočerih +trikratnih +trojih +desetere +dvakratne +dvoje +enkratne +petere +stotere +tisočere +trikratne +troje +deseterim +dvakratnim +dvojim +enkratnim +peterim +stoterim +tisočerim +trikratnim +trojim +deseterimi +dvakratnimi +dvojimi +enkratnimi +peterimi +stoterimi +tisočerimi +trikratnimi +trojimi +desetero +dvakratno +dvojo +enkratno +petero +stotero +tisočero +trikratno +trojo +desetera +dvakratna +dvoja +enkratna +petera +stotera +tisočera +trikratna +troja +deseterega +dvakratnega +dvojega +enkratnega +peterega +stoterega +tisočerega +trikratnega +trojega +deseter +dvakraten +dvoj +enkraten +peter +stoter +tisočer +trikraten +troj +deseteremu +dvakratnemu +dvojemu +enkratnemu +peteremu +stoteremu +tisočeremu +trikratnemu +trojemu +deseterem +dvakratnem +dvojem +enkratnem +peterem +stoterem +tisočerem +trikratnem +trojem +le-onega +le-tega +le-tistega +le-toliko +onega +tega +tistega +toliko +le-oni +le-takšni +le-taki +le-te +le-ti +le-tisti +oni +takšni +taki +te +ti +tisti +le-onima +le-takšnima +le-takima +le-tema +le-tistima +onima +takšnima +takima +tema +tistima +le-onih +le-takšnih +le-takih +le-teh +le-tistih +onih +takšnih +takih +teh +tistih +le-one +le-takšne +le-take +le-tiste +one +takšne +take +tiste +le-onim +le-takšnim +le-takim +le-tem +le-tistim +onim +takšnim +takim +tem +tistim +le-onimi +le-takšnimi +le-takimi +le-temi +le-tistimi +onimi +takšnimi +takimi +temi +tistimi +le-ono +le-takšno +le-tako +le-tisto +le-to +ono +takšno +tako +tisto +to +le-tej +tej +le-ona +le-ta +le-takšna +le-taka +le-tista +ona +ta +takšna +taka +tista +le-tak +le-takšen +tak +takšen +le-takšnega +le-takega +takšnega +takega +le-onemu +le-takšnemu +le-takemu +le-temu +le-tistemu +onemu +takšnemu +takemu +temu +temuintemu +tistemu +le-onem +le-takšnem +le-takem +le-tistem +onem +takšnem +takem +tistem +vsakogar +vsakomur +vsakomer +vsakdo +obe +vsaki +vsakršni +vsi +obema +vsakima +vsakršnima +vsema +obeh +vsakih +vsakršnih +vseh +vsake +vsakršne +vse +vsakim +vsakršnim +vsem +vsakimi +vsakršnimi +vsemi +vsako +vsakršno +vso +vsej +vsa +vsaka +vsakršna +oba +ves +vsak +vsakršen +vsakega +vsakršnega +vsega +vsakemu +vsakršnemu +vsemu +vsakem +vsakršnem +enako +istega +koliko +mnogo +nekoga +nekoliko +precej +kaj +koga +marsikaj +marsikoga +nekaj +čemu +komu +marsičemu +marsikomu +nečemu +nekomu +česa +marsičesa +nečesa +kom +marsičim +marsikom +nečim +nekom +čem +marsičem +nečem +kdo +marsikdo +nekdo +čigavi +drugačni +enaki +isti +kakšni +kaki +kakršnikoli +kateri +katerikoli +kolikšni +koliki +marsikateri +nekakšni +nekaki +nekateri +neki +takile +tele +tile +tolikšni +toliki +čigavima +drugačnima +enakima +enima +istima +kakšnima +kakima +kakršnimakoli +katerima +katerimakoli +kolikšnima +kolikima +marsikaterima +nekakšnima +nekakima +nekaterima +nekima +takimale +temale +tolikšnima +tolikima +čigavih +drugačnih +enakih +enih +istih +kakšnih +kakih +kakršnihkoli +katerih +katerihkoli +kolikšnih +kolikih +marsikaterih +nekakšnih +nekakih +nekaterih +nekih +takihle +tehle +tolikšnih +tolikih +čigave +drugačne +enake +iste +kakšne +kake +kakršnekoli +katere +katerekoli +kolikšne +kolike +marsikatere +nekakšne +nekake +nekatere +neke +takele +tolikšne +tolike +čigavim +drugačnim +enakim +istim +kakšnim +kakim +kakršnimkoli +katerim +katerimkoli +kolikšnim +kolikim +marsikaterim +nekakšnim +nekakim +nekaterim +nekim +takimle +temle +tolikšnim +tolikim +čigavimi +drugačnimi +enakimi +enimi +istimi +kakšnimi +kakimi +kakršnimikoli +katerimi +katerimikoli +kolikšnimi +kolikimi +marsikaterimi +nekakšnimi +nekakimi +nekaterimi +nekimi +takimile +temile +tolikšnimi +tolikimi +čigavo +drugačno +isto +kakšno +kako +kakršnokoli +katero +katerokoli +kolikšno +marsikatero +nekakšno +nekako +nekatero +neko +takole +tole +tolikšno +tejle +čigava +drugačna +enaka +ista +kakšna +kaka +kakršnakoli +katera +katerakoli +kolikšna +kolika +marsikatera +neka +nekakšna +nekaka +nekatera +takale +tale +tolikšna +tolika +čigav +drug +drugačen +enak +kak +kakšen +kakršenkoli +kakršnegakoli +kateregakoli +kolik +kolikšen +nek +nekak +nekakšen +takegale +takle +tegale +tolik +tolikšen +čigavega +drugačnega +enakega +kakšnega +kakega +katerega +kolikšnega +kolikega +marsikaterega +nekakšnega +nekakega +nekaterega +nekega +tolikšnega +tolikega +čigavemu +drugačnemu +enakemu +istemu +kakšnemu +kakemu +kakršnemukoli +kateremu +kateremukoli +kolikšnemu +kolikemu +marsikateremu +nekakšnemu +nekakemu +nekateremu +nekemu +takemule +temule +tolikšnemu +tolikemu +čigavem +drugačnem +enakem +istem +kakšnem +kakem +kakršnemkoli +katerem +kateremkoli +kolikšnem +kolikem +marsikaterem +nekakšnem +nekakem +nekaterem +nekem +takemle +tolikšnem +tolikem +naju +nama +midva +nas +nam +nami +mi +mene +me +meni +mano +menoj +jaz +vaju +vama +vidva +vas +vam +vami +vi +tebe +tebi +tabo +teboj +njiju +jih +ju +njima +jima +onedve +onidve +nje +njih +njim +jim +njimi +njo +jo +njej +nji +ji +je +onadva +njega +ga +njemu +mu +njem +on +čigar +kolikor +kar +karkoli +kogar +kogarkoli +čemur +čemurkoli +komur +komurkoli +česar +česarkoli +čimer +čimerkoli +komer +komerkoli +čemer +čemerkoli +kdor +kdorkoli +kakršni +kakršnima +kakršnih +kakršne +kakršnim +kakršnimi +kakršno +kakršna +kakršen +kakršnega +kakršnemu +kakršnem +najini +naši +moji +najinima +našima +mojima +najinih +naših +mojih +najine +naše +moje +najinim +našim +mojim +najinimi +našimi +mojimi +najino +našo +mojo +najina +naša +moja +najin +najinega +naš +našega +moj +mojega +najinemu +našemu +mojemu +najinem +našem +mojem +vajini +vaši +tvoji +vajinima +vašima +tvojima +vajinih +vaših +tvojih +vajine +vaše +tvoje +vajinim +vašim +tvojim +vajinimi +vašimi +tvojimi +vajino +vašo +tvojo +vajina +vaša +tvoja +vajin +vajinega +vaš +vašega +tvoj +tvojega +vajinemu +vašemu +tvojemu +vajinem +vašem +tvojem +njuni +njihovi +njeni +njegovi +njunima +njihovima +njenima +njegovima +njunih +njihovih +njenih +njegovih +njune +njihove +njene +njegove +njunim +njihovim +njenim +njegovim +njunimi +njihovimi +njenimi +njegovimi +njuno +njihovo +njeno +njegovo +njuna +njihova +njena +njegova +njun +njunega +njihov +njihovega +njen +njenega +njegov +njegovega +njunemu +njihovemu +njenemu +njegovemu +njunem +njihovem +njenem +njegovem +se +si +sebe +sebi +sabo +seboj +svoji +svojima +svojih +svoje +svojim +svojimi +svojo +svoja +svoj +svojega +svojemu +svojem +nikogar +noben +ničemur +nikomur +ničesar +ničimer +nikomer +ničemer +nihče +nikakršni +nobeni +nikakršnima +nobenima +nikakršnih +nobenih +nikakršne +nobene +nikakršnim +nobenim +nikakršnimi +nobenimi +nikakršno +nobeno +nikakršna +nobena +nikakršen +nikakršnega +nobenega +nikakršnemu +nobenemu +nikakršnem +nobenem +še +šele +žal +že +baje +bojda +bržčas +bržkone +celo +dobesedno +domala +edinole +gotovo +itak +ja +kajne +kajpada +kajpak +koli +komaj +le +malone +mar +menda +morda +morebiti +nadvse +najbrž +nemara +nerad +neradi +nikar +pač +pogodu +prav +pravzaprav +predvsem +preprosto +rad +rada +rade +radi +ravno +res +resda +samo +seveda +skoraj +skorajda +spet +sploh +tudi +všeč +verjetno +vnovič +vred +vsaj +zadosti +zapored +zares +zgolj +zlasti +zopet +čezenj +čeznje +mednje +mednju +medse +nadenj +nadme +nadnje +name +nanj +nanje +nanjo +nanju +nase +nate +obenj +podnjo +pome +ponj +ponje +ponjo +pote +predenj +predme +prednje +predse +skozenj +skoznje +skoznjo +skozte +vame +vanj +vanje +vanjo +vanju +vase +vate +zame +zanj +zanje +zanjo +zanju +zase +zate +čez +med +na +nad +ob +po +pod +pred +raz +skoz +skozi +v +za +zoper +h +k +kljub +nasproti +navkljub +navzlic +proti +ž +blizu +brez +dno +do +iz +izmed +iznad +izpod +izpred +izven +izza +krog +mimo +namesto +naokoli +naproti +od +okoli +okrog +onkraj +onstran +poleg +povrh +povrhu +prek +preko +razen +s +spod +spričo +sredi +vštric +vpričo +vrh +vrhu +vzdolž +z +zaradi +zavoljo +zraven +zunaj +o +pri +bi +bova +bomo +bom +bosta +boste +boš +bodo +bojo +bo +sva +nisva +smo +nismo +sem +nisem +sta +nista +ste +niste +nisi +so +niso +ni +bodiva +bodimo +bodita +bodite +bodi +biti +bili +bila +bile +bil +bilo +želiva +dovoliva +hočeva +marava +morava +moreva +smeva +zmoreva +nočeva +želimo +dovolimo +hočemo +maramo +moramo +moremo +smemo +zmoremo +nočemo +želim +dovolim +hočem +maram +moram +morem +smem +zmorem +nočem +želita +dovolita +hočeta +marata +morata +moreta +smeta +zmoreta +nočeta +želite +dovolite +hočete +marate +morate +morete +smete +zmorete +nočete +želiš +dovoliš +hočeš +maraš +moraš +moreš +smeš +zmoreš +nočeš +želijo +dovolijo +hočejo +marajo +morajo +morejo +smejo +zmorejo +nočejo +želi +dovoli +hoče +mara +mora +more +sme +zmore +noče +hotiva +marajva +hotimo +marajmo +hotita +marajta +hotite +marajte +hoti +maraj +želeti +dovoliti +hoteti +marati +moči +morati +smeti +zmoči +želeni +dovoljeni +želena +dovoljena +želene +dovoljene +želen +dovoljen +želeno +dovoljeno +želeli +dovolili +hoteli +marali +mogli +morali +smeli +zmogli +želela +dovolila +hotela +marala +mogla +morala +smela +zmogla +želele +dovolile +hotele +marale +mogle +morale +smele +zmogle +želel +dovolil +hotel +maral +mogel +moral +smel +zmogel +želelo +dovolilo +hotelo +maralo +moglo +moralo +smelo +zmogl diff --git a/stopwords/spanish b/stopwords/spanish new file mode 100644 index 0000000..6a7d50c --- /dev/null +++ b/stopwords/spanish @@ -0,0 +1,313 @@ +de +la +que +el +en +y +a +los +del +se +las +por +un +para +con +no +una +su +al +lo +como +más +pero +sus +le +ya +o +este +sí +porque +esta +entre +cuando +muy +sin +sobre +también +me +hasta +hay +donde +quien +desde +todo +nos +durante +todos +uno +les +ni +contra +otros +ese +eso +ante +ellos +e +esto +mí +antes +algunos +qué +unos +yo +otro +otras +otra +él +tanto +esa +estos +mucho +quienes +nada +muchos +cual +poco +ella +estar +estas +algunas +algo +nosotros +mi +mis +tú +te +ti +tu +tus +ellas +nosotras +vosotros +vosotras +os +mío +mía +míos +mías +tuyo +tuya +tuyos +tuyas +suyo +suya +suyos +suyas +nuestro +nuestra +nuestros +nuestras +vuestro +vuestra +vuestros +vuestras +esos +esas +estoy +estás +está +estamos +estáis +están +esté +estés +estemos +estéis +estén +estaré +estarás +estará +estaremos +estaréis +estarán +estaría +estarías +estaríamos +estaríais +estarían +estaba +estabas +estábamos +estabais +estaban +estuve +estuviste +estuvo +estuvimos +estuvisteis +estuvieron +estuviera +estuvieras +estuviéramos +estuvierais +estuvieran +estuviese +estuvieses +estuviésemos +estuvieseis +estuviesen +estando +estado +estada +estados +estadas +estad +he +has +ha +hemos +habéis +han +haya +hayas +hayamos +hayáis +hayan +habré +habrás +habrá +habremos +habréis +habrán +habría +habrías +habríamos +habríais +habrían +había +habías +habíamos +habíais +habían +hube +hubiste +hubo +hubimos +hubisteis +hubieron +hubiera +hubieras +hubiéramos +hubierais +hubieran +hubiese +hubieses +hubiésemos +hubieseis +hubiesen +habiendo +habido +habida +habidos +habidas +soy +eres +es +somos +sois +son +sea +seas +seamos +seáis +sean +seré +serás +será +seremos +seréis +serán +sería +serías +seríamos +seríais +serían +era +eras +éramos +erais +eran +fui +fuiste +fue +fuimos +fuisteis +fueron +fuera +fueras +fuéramos +fuerais +fueran +fuese +fueses +fuésemos +fueseis +fuesen +sintiendo +sentido +sentida +sentidos +sentidas +siente +sentid +tengo +tienes +tiene +tenemos +tenéis +tienen +tenga +tengas +tengamos +tengáis +tengan +tendré +tendrás +tendrá +tendremos +tendréis +tendrán +tendría +tendrías +tendríamos +tendríais +tendrían +tenía +tenías +teníamos +teníais +tenían +tuve +tuviste +tuvo +tuvimos +tuvisteis +tuvieron +tuviera +tuvieras +tuviéramos +tuvierais +tuvieran +tuviese +tuvieses +tuviésemos +tuvieseis +tuviesen +teniendo +tenido +tenida +tenidos +tenidas +tened diff --git a/stopwords/swedish b/stopwords/swedish new file mode 100644 index 0000000..742bb62 --- /dev/null +++ b/stopwords/swedish @@ -0,0 +1,114 @@ +och +det +att +i +en +jag +hon +som +han +på +den +med +var +sig +för +så +till +är +men +ett +om +hade +de +av +icke +mig +du +henne +då +sin +nu +har +inte +hans +honom +skulle +hennes +där +min +man +ej +vid +kunde +något +från +ut +när +efter +upp +vi +dem +vara +vad +över +än +dig +kan +sina +här +ha +mot +alla +under +någon +eller +allt +mycket +sedan +ju +denna +själv +detta +åt +utan +varit +hur +ingen +mitt +ni +bli +blev +oss +din +dessa +några +deras +blir +mina +samma +vilken +er +sådan +vår +blivit +dess +inom +mellan +sådant +varför +varje +vilka +ditt +vem +vilket +sitta +sådana +vart +dina +vars +vårt +våra +ert +era +vilkas diff --git a/stopwords/tajik b/stopwords/tajik new file mode 100644 index 0000000..898614a --- /dev/null +++ b/stopwords/tajik @@ -0,0 +1,163 @@ +аз +дар +ба +бо +барои +бе +то +ҷуз +пеши +назди +рӯйи +болои +паси +ғайри +ҳамон +ҳамоно +инҷониб +замон +замоно +эътиборан +пеш +қабл +дида +сар карда +агар +агар ки +валекин +ки +лекин +аммо +вале +балки +ва +ҳарчанд +чунки +зеро +зеро ки +вақте ки +то вақте ки +барои он ки +бо нияти он ки +лекин ва ҳол он ки +ё +ё ин ки +бе он ки +дар ҳолате ки +то даме ки +баъд аз он ки +даме ки +ба тразе ки +аз баҳри он ки +гар +ар +ба шарте +азбаски +модоме ки +агар чи +гарчанде ки +бо вуҷуди он ки +гӯё +аз-баски +чун-ки +агар-чанд +агар-чи +гар-чи +то ки +чунон ки +то даме ки +ҳар қадар ки +магар +оё +наход +ҳатто +ҳам +бале +оре +хуб +хуш +хайр +не +на +мана +э +фақат +танҳо +кошки +мабодо +ҳтимол +ана ҳамин +наход ки +ҳатто ки +аз афташ +майлаш куя +ана +ҳа +канӣ +гӯё ки +ҳо ана +на ин ки +ваҳ +ҳой +и +а +о +эҳ +ҳе +ҳу +аҳа +оҳе +уҳа +ҳм +нм +оббо +ӯббо +ҳой-ҳой +вой-вой +ту-ту +ҳмм +эҳа +тавба +ӯҳӯ +аҷабо +ало +аё +ой +ӯим +ором +хом?ш +ҳай-ҳай +бай-бай +аз +он +баъд +азбаски +ӯ +ҳангоми +чӣ +кадом +ин +ҷо +ҳам +ё ки +бояд +аст +чанд +ҳар +бар +чаро ки +агар +то кӣ +бинобар +бинобар ин +ҳаргиз +асло +нахот +нахот ки +кошкӣ +шояд +шояд ки +охир +аз рӯи +аз рӯйи +рӯ \ No newline at end of file diff --git a/stopwords/turkish b/stopwords/turkish new file mode 100644 index 0000000..5a48ccc --- /dev/null +++ b/stopwords/turkish @@ -0,0 +1,53 @@ +acaba +ama +aslında +az +bazı +belki +biri +birkaç +birşey +biz +bu +çok +çünkü +da +daha +de +defa +diye +eğer +en +gibi +hem +hep +hepsi +her +hiç +için +ile +ise +kez +ki +kim +mı +mu +mü +nasıl +ne +neden +nerde +nerede +nereye +niçin +niye +o +sanki +şey +siz +şu +tüm +ve +veya +ya +yani