gkrishnan
/

Multiple_Document_QA_Model

Model card Files Files and versions

Multiple_Document_QA_Model / app.py

gkrishnan's picture

Create app.py

ceb7321 almost 3 years ago

history blame contribute delete

1.73 kB

	from langchain.text_splitter import CharacterTextSplitter
	from langchain.embeddings import HuggingFaceEmbeddings
	from langchain.vectorstores import Chroma
	from langchain import HuggingFacePipeline
	from langchain.chains import RetrievalQA
	from transformers import AutoTokenizer
	import pickle
	import os

	with open('shakespeare.pkl', 'rb') as fp:
	data = pickle.load(fp)

	bloomz_tokenizer = AutoTokenizer.from_pretrained('bigscience/bloomz-1b7')

	text_splitter = CharacterTextSplitter.from_huggingface_tokenizer(bloomz_tokenizer, chunk_size=100, chunk_overlap=0, separator='\n')

	documents = text_splitter.split_documents(data)

	embeddings = HuggingFaceEmbeddings()

	persist_directory = "vector_db"

	vectordb = Chroma.from_documents(documents=documents, embedding=embeddings, persist_directory=persist_directory)

	vectordb.persist()
	vectordb = None

	vectordb_persist = Chroma(persist_directory=persist_directory, embedding_function=embeddings)

	llm = HuggingFacePipeline.from_model_id(
	model_id="bigscience/bloomz-1b7",
	task="text-generation",
	model_kwargs={"temperature" : 0, "max_length" : 500})

	doc_retriever = vectordb_persist.as_retriever()

	shakespeare_qa = RetrievalQA.from_chain_type(llm=llm, chain_type="stuff", retriever=doc_retriever)

	def make_inference(query):
	inference = shakespeare_qa.run(query)
	return inference

	if __name__ == "__main__":
	# make a gradio interface
	import gradio as gr

	gr.Interface(
	make_inference,
	gr.inputs.Textbox(lines=2, label="Query"),
	gr.outputs.Textbox(label="Response"),
	title="Ask_Shakespeare",
	description="️building_w_llms_qa_Shakespeare allows you to inquire about the Shakespeare's plays.",
	).launch()