switching from semaphore to lock (7b293d9b) · Commits · candle / Megatron-LM

megatron/text_generation_server.py

+4 −5

Original line number	Diff line number	Diff line
		@@ -23,7 +23,7 @@ from megatron import mpu
		from megatron.text_generation_utils import generate

		GENERATE_NUM = 0
		lock = threading.Semaphore()
		lock = threading.Lock()

		class MegatronGenerate(Resource):
		def __init__(self, model):
		@@ -71,10 +71,9 @@ class MegatronGenerate(Resource):
		if not isinstance(add_BOS, bool):
		return "add_BOS must be a boolean value"

		lock.acquire() # Need to get lock to keep multiple threads from hitting code
		with lock: # Need to get lock to keep multiple threads from hitting code
		MegatronGenerate.send_do_generate() # Tell other ranks we're doing generate
		resp_sentences, resp_sentences_seg, output_logits, full_logits, tokens = generate(self.model, sentences, tokens_to_generate, all_probs, temperature, add_BOS)
		lock.release()

		if all_probs:
		return jsonify({"sentences": resp_sentences,